站長阿川

站長阿川私房教材:
學 JavaScript 前端,帶作品集去面試!

站長精心設計,帶你實作 63 個小專案,得到作品集!

立即開始免費試讀!

生成AI相關書籍將另行列出,本文是基於之前所寫的內容進行大幅增補。以「2025年版 學習生成AI・大型語言模型的30本書」的形式呈現。

  • 目前在R&D部門主要從事技術調查工作,已經與開發脫節。此外我對開發的興趣並不高,因此對於Dify、代理、LangChain、MCP等的了解非常薄弱。
  • 主要聚焦於文本類生成AI和大型語言模型,而圖像和音頻相關的內容則是輔助性的。
  • 文章僅代表IT企業的工程師視角,並不代表學術界的觀點,敬請見諒。

關於閱讀順序的流程圖,我思考了很久仍然在思考中。
大體上是按照難度的順序,但這本書可以跳過,也有些人認為反向順序更容易理解,這僅僅是方便的參考指標。

類別 必須 定番 差異 合計
用戶類別 1 2 2 5
內部導入類 0 1 0 1
理論・實作 4 9 6 19
建設類別 0 3 2 5
合計 5 15 10 30

用戶類別

生成AI的原理不必過於深入,首先先試著使用它。為此,了解從最低限度的提示到巧妙的使用方式是必要的。

高階的提示工程學則可以往「開發類」去看。

書名 內容
面倒なことはChatGPTにやらせよう - 雖然2024年1月發售但已經成為「經典」。在生成AI的世界裡這本書已經算是老書,雖然有很多同類書籍,但在「讓ChatGPT執行某些工作」上本書最為合適<br>- 之後出現的書籍類似於「在編輯的催促下填充淺薄內容」,而本書則給人一種「能滿足需求的感覺」,或是「經過篩選的實用技巧」的感覺<br>- 可能與作者所著的Kaggle的「淺書」等技術出版界的特徵有關
深津式プロンプト読本 - 因此在「面倒なことは」之後閱讀了幾本書,但未能找到決定性的一本。在淹沒於同類書中,因為前述書的作者推薦,開始閱讀這本,果然是好書<br>- 整理提示方法,適合文本生成或Q&A的商業利用
AI時代の質問力 プロンプトリテラシー 「問い」と「指示」が生成AIの可能性を最大限に引き出す - 書中有許多與類書類似的章節標題,如persona模式、Chain-of-Thought模式、ReACT模式,但並不僅僅是提示集<br>- 專注於「素養」這個主題,因此幾乎沒有提示的技巧<br>- 可能是想表達擁有一種思考時的操作系統的概念<br>- 重申一下,<br> - 需要執行的話請看《面倒なことはChatGPTにやらせよう》<br> - 進行文本溝通時可參考《深津式プロンプト》<br> - 基礎理念則看《プロンプトリテラシー》
生成AIスキルとしての言語学 - 從語言學的立場出發,原本以為會講些艱澀的話題,沒想到卻是實用的提示相關的討論,這非常棒<br>- 從生成AI對話的語言層面進行整理
AIを使って考えるための全技術 - 更加專注於利用生成AI協助思考的點子發想,為個人腦力激盪量身打造的提示與實用技巧集<br>- 當談到生成AI的使用時,絕大部分人會想到「摘要」或程式碼撰寫等,但有人會因哈爾西內化問題而無法使用,但其實焦點並不在此,別府君!<br>- 當前生成AI的價值在於協助思考,像是一起進行腦力激盪,這是本書的真傳

內部導入類

雖然有很多同類書籍,但大部分都是容易消失的資料小冊子,真能整理要點的正經書籍只有這一本。

書名 內容
実践 生成AIの教科書 - 由日立所撰寫,講述企業使用生成AI的知識與注意事項<br>- 同類書籍多半僅集中於功能介紹,但在企業使用中,如何組織以及倫理與安全等問題非常關注,而本書則涵蓋了這些方面

理論・開發類

從工程師的視角出發,了解應該掌握的理論與實作書籍。實作內容主要是以Transformers為中心進行模型處理。
如前所述,因為我在LangChain或MCP上並沒有太多經驗,所以這部分薄弱。

理論・實作類

深層學習

深層學習需要的前提知識另行列出。

自然語言處理

部分內容會與「機器學習・數據分析的必備10本+實用90本+Next5本」的清單重複,但再次列出。

書名 內容
放送大学 自然言語処理入門 - 雖然不起眼,但作為自然語言處理領域的概述文獻剛好合適
自然言語処理の教科書 - 前言說「本書旨在成為有關開發的手冊,如果你對研究有興趣,請參閱放送大学的書籍《自然言語処理〔三訂版〕》(放送大学教育振興會, 2023)或《IT Text 自然言語處理の基礎》(オーム社, 2022)」,正是為工程師的入門教科書。<br>- 數學公式最小化,廣泛涵蓋了傳統自然語言處理、Transformer、大型語言模型以及語料庫等話題。<br>- 前言中提到,讀完本書後再看下一本《IT Text 自然言語處理の基礎》會更好。
IT Text 自然言語処理の基礎 - 確實很重要<br>- 隨著大型語言模型的風行,許多有關提示的書籍不斷出現,而這些書籍各有特點,然而這不可替代,時潮會隨著時間消逝;<br>- 但即使網路環境變遷,TCP/IP的基礎技術依然穩固,因此我們也要專注於這些根本技術的學習<br> - 第1章 自然語言處理概述<br> - 第2章 機器學習基礎<br> - 第3章 單詞向量表示<br> - 第4章 針對序列的神經網絡<br> - 第5章 語言模型與序列轉換模型<br> - 第6章 Transformer<br> - 第7章 預訓練模型與遷移學習<br> - 第8章 序列標記<br> - 第9章 語法分析<br> - 第10章 意義解析<br> - 第11章 應用任務與總結
統計的テキストモデル──言語へのベイズ的アプローチ - 在目錄中可以看到,本書中並未提及Word2Vec和Transformer等<br>- 本書是針對如何以統計模型處理自然語言的專業書籍,並非集中於神經網絡的著作<br>- 在Transformer成為「標準」的當下,許多思路依然被提及,理解這些是基本訓練的一部分
ゼロから作るDeep Learning ❷ ―自然言語処理編 - 從自然語言的向量化到進入Transformer的過程完全從零開始進行編碼<br>- 雖然我將它歸為「實作」,但實際上它並不是LLM的實作,而是透過編碼的過程來理解理論

生成AI

「生成AI」和「LLM(大型語言模型)」在現今世界中經常被混用。我自己對此進行了一些整理,寫了另一篇文章。

大致來說

  • AI
    • 預測・識別AI
    • 生成AI
  • LLM(大型語言模型)
    • 編碼器類型
    • 擅長分類
    • 編碼器・解碼器類型
    • 擅長摘要與翻譯
    • 解碼器類型
    • 擅長生成
  • 另外還有圖像和音頻的研究

隨著深層學習的進展,深層生成學習取得了驚人的演變,現在總稱為「生成AI」。即使在LLM中,進行深層生成學習的解碼器類型也逐漸能夠執行分類或摘要翻譯等任務。而圖像或音頻的生成AI也在進步,所以目前主流的是基於解碼器的深層生成學習,也就是生成AI。

這部分清單大致是針對生成AI≒深層生成學習的書籍!

書名 內容
生成AIのしくみ 〈流れ〉が画像・音声・動画をつくる - 繼《大型語言模型是否為新智力》後,針對生成模型一般和擴散模型進行的解說書
深層学習 生成AIの基礎 - 作為深層學習文本系列的一本,專注於深層生成學習<br>- 因此深層學習的基礎最好另有書籍來鞏固,但本書將從神經網絡出發,涵蓋深層學習、Transformer、強化學習、擴散模型、GAN等眾多內容<br>- 可以作為大致了解深層生成學習基礎的入門書
機械学習のための確率過程入門(増補改訂版): 確率微分方程式からベイズモデル,拡散モデルまで - 我只讀過初版,這是改訂版<br>- 本書是針對概率模型的文本,其中也討論了一些擴散模型<br>- 隨著擴散模型和其他概率模型的步伐逐漸增多,因此有必要鞏固這方面的基礎
拡散モデル データ生成技術の数理 - 這是專門針對擴散模型的書籍,這是唯一一本日文書籍<br>- 這本書老實說難度挺高
原論文から解き明かす生成AI - 接下來的書籍已經需要靠閱讀論文來解釋了,儘管生成AI已經能夠進行摘要和翻譯,但其研究趨勢對工程師來說很難把握,因此出現了這本非常有用的書<br>- 書中對於Transformer和擴散模型陸續介紹了幾篇重要論文<br>- 雖然有部分寫得比文本更容易理解,但閱讀順序的偏好可能因人而異,先讀本書也會不錯,但若閱讀完其他文本,再來對照本書會更容易明白。
ゼロから作るDeep Learning ❺ ―生成モデル編 - 雖然理論書中的內容你可能會感到困惑,但在此時讓我們從「零開始學習」吧!<br>- 大家熟知的「從零開始學習深度學習」系列終於推出生成模型版<br>- 從概率分布出發,進入概率模型,VAE與擴散模型等
生成 Deep Learning 第2版 ―繪畫、敘事、音樂創作及遊戲玩法 - 本書展示了使用各種生成AI的實作例<br>- 比起初版,最新動態有了更新對於Transformer、VAE、GAN、擴散模型的介紹更新,還有針對文本、圖像、音頻進行更新,以及必須的「世界模型」的介紹!

LLM(大型語言模型)

如前所述,LLM並不是全部的生成AI,但在實務中LLM在生成AI中占有重要地位。

書名 內容
大規模言語モデルは新たな知能か ChatGPTが変えた世界 - 大型語言模型竟然會流行到這個程度!<br>- 雖然雨後春筍一般的相關書籍出現,但大部分最終都會消失。本篇考慮書籍的本質<br>- 雖然難度不小,但PFN的岡野原先生撰寫了易於理解的解說書
大規模言語モデル入門 - 可以通過使用transformers庫進行編碼,親身接觸大型語言模型的理論與實作,這是一本很棒的書<br>- 基本上可以在Google Colaboratory的免費方案下運作<br>- 目錄大致如下,可以一一學習大型語言模型<br> - 第1章 開始(transformers來解決自然語言處理)<br> - 第2章 Transformer<br> - 第3章 大型語言模型的基礎<br> - 第4章 大型語言模型的進展<br> - 第5章 大型語言模型的微調<br> - 第6章 固有名詞識別<br> - 第7章 摘要生成<br> - 第8章 句子嵌入<br> - 第9章 問答
大規模言語モデル入門Ⅱ〜生成型LLMの実装と評価 - 這不是改訂版,而是系列的持續更新<br>- II將需要購買付費的Google Colaboratory處理較多<br> - 第10章 性能評估<br> - 第11章 指示微調<br> - 第12章 偏好微調<br> - 第13章 RAG<br> - 第14章 分散並行學習
直感 LLM ハンズオンで動かして学ぶ大規模言語モデル入門 - 大致上會與《大規模語言模型入門I, II》內容重疊<br>- 本書由於更為新穎,兼容了較新的庫版本,也許會更有用

提示工程學

這部分包含超出用戶類別「提示」,更深入的提示工程學,針對編碼的提示,或者為了構築RAG和代理而考慮到的提示及其他工具的協作API等方面的書籍。

書名 內容
LLMのプロンプトエンジニアリング —GitHub Copilotを生んだ開発者が教える生成AIアプリケーション開発 - 一上市就缺貨。雖然有許多類似書籍,但這是O'Reilly出的書,品質保證<br>- 這本書專注於LLM的提示工程學全般的介紹
生成AIのプロンプトエンジニアリング ―信頼できる生成AIの出力を得るための普遍的な入力の原則 - 本書與前一本類似,但這是「生成AI」的,涵蓋了圖像生成的提示,使用API進行RAG以及與代理的連結等

圖像生成

由於在業務中幾乎沒有關係,因此知識淺薄,但還是想要有基本的認識,因此確認這部分內容。

書名 內容
Pythonで学ぶ画像生成 機械学習実践シリーズ - 由於音頻分析系列書比較容易理解,因此選擇了這本書<br>- 覆蓋了從圖像生成的基礎到擴散模型Stable Diffusion的基礎與實作例

建設類

如前所述,由於在業務中幾乎不接觸此領域且興趣低,因此知識薄弱。這裡的同類書籍可能是最多的。
讀了幾本類似書,但希望能對於需取得最低基礎知識的讀者有所幫助,敬請見諒。

應用程序開發平台

書名 內容
生成AIアプリ開発大全――Difyの探求と実践活用 - 在生成AI應用開發平台上不可或缺的Dify<br>- 由於O'Reilly的書還未出版,因此選擇了技術評論社的這本,結果閱讀後確認這本書與同類書籍在水準上有不小的差距

RAG・代理

書名 內容
LangChainとLangGraphによるRAG・AIエージェント[実践]入門 - 有許多同類書籍,而且用途和庫的不同也意味著選擇有差異。本書是最基本「LangChain」的選書<br>- 雖然市面上有很多書籍只偏重於使用方法,但本書也得到了技術評論社的好評,因此確認這本書水準上明顯優於同類書籍
現場で活用するためのAIエージェント実践入門 - 以「想要卻買不到的熱賣書」而聲名大噪,如今已經發行了Kindle版<br>- 雖然市面上有很多書籍簡單提供代理的製作方法,但本書從「代理是什麼」開始介紹,因此這本書可能更符合「要成為專業人士的必要書籍」。

RAG相關

書名 內容
はじめての知識グラフ構築ガイド - 本書並不是針對LLM或RAG的書籍!<br>- 在RAG的書籍还不存在的時候發現了這本書,是關於知識圖譜的概述書籍<br>- 雖然RAG的書籍中很多會詳細介紹與LLM的結合,但對於知識圖譜的解說薄弱,因此此書有補強的意義

原文出處:https://qiita.com/aokikenichi/items/bc3646f6481532cbed90


共有 0 則留言


精選技術文章翻譯,幫助開發者持續吸收新知。
站長阿川

站長阿川私房教材:
學 JavaScript 前端,帶作品集去面試!

站長精心設計,帶你實作 63 個小專案,得到作品集!

立即開始免費試讀!