スクリーンショット 2026-05-26 9.56.48.png

大約一個月前公開、引發關注的「LLM Wiki」。
過了一段時間,我重新稍微拆解了一下,來看看它到底是什麼!

什麼是 LLM Wiki

スクリーンショット 2026-05-26 9.49.59.png

  • 由 Andrej Karpathy(OpenAI 創辦成員之一,Tesla 前 AI 資深總監)以 GitHub Gist 的點子文件形式公開。
  • 這是一種讓 LLM 代理人持續建立與維護永久性 Markdown Wiki 的知識管理模式;不是每次都像 RAG 那樣去搜尋知識,而是將知識累積成經過編輯的百科全書。

與 RAG 的差異

スクリーンショット 2026-05-26 9.50.29.png

作為比較對象,文章提到了「RAG(檢索增強生成)」。
我從「結構」與「運作」兩個角度來比較看看。

結構上的差異

以索引的結構來看:

  • RAG ≒ 倉庫
    • 原始資料未經編輯,直接作為 I/O 使用。
      • → 容易造成各文件的結構與粒度差異很大。
  • LLM Wiki ≒ 圖書館
    • 參考原始資料後,使用的是經過編輯的內容作為 I/O。
      • → 能抑制各文件的結構與粒度不一致。

LLM Wiki 的索引由 LLM 持續建立並維護,因此會不斷進化,這是它最大的特徵。

運作上的差異

如果用軟體工程來類比:

  • RAG → 每次都用直譯器執行原始碼
  • LLM Wiki → 先編譯一次,然後持續讓那個可執行檔成長

架構

スクリーンショット 2026-05-26 9.51.14.png

LLM Wiki 由三個層次構成,且各自「誰寫、誰讀」的分工非常明確。

第 1 層:Raw sources

  • 概要:
    • 收納文章、論文、圖片等蒐集來的一次資料(原始資料)。
    • 這些資料不會被改動,是 Wiki 的根據。
  • 分工:
    • 一次資料的蒐集與放置:人類
    • 一次資料的讀取:LLM

第 2 層:The Wiki

  • 概要:
    • 由 LLM 產生的 Markdown 檔集合。
    • 包含摘要、實體頁、概念頁、比較表、總覽、整合頁等。
    • 由 LLM 完全負責,建立與更新頁面、維持交叉參照,並保持一致性。
  • 分工:
    • Wiki 的管理:LLM
    • Wiki 的參照:人類

第 3 層:The Schema

  • 概要:
    • 教 LLM Wiki 結構、規範與工作流程(匯入、問答、維護)的文件。
      • 例如:CLAUDE.md(給 Claude Code 用)、AGENTS.md(給 Codex 用)、...
  • 分工:
    • 整體管理:人類、LLM

作業流程

LLM Wiki 主要透過三種操作來運作。

① Ingest

スクリーンショット 2026-05-26 11.09.17.png

  • 每匯入一份新資料,就會影響 Wiki 的 10~15 個頁面。
  • LLM 不會只是把它當成搜尋對象,而是會讀取內容、擷取重要資訊,並整合進既有的 Wiki。

② Query

スクリーンショット 2026-05-26 11.10.15.png

  • 關鍵是名為 index.md 的檔案(※詳情後述),它是所有 Wiki 頁面的目錄(附有一行摘要、按類別整理)。
  • 當提出問題時,LLM 會先讀取 index,找出相關頁面,再深入閱讀並整合答案。
  • 這個系統的特色是,不需要 embedding 基礎設施也能運作。具價值的答案會被「歸檔」成新的 Wiki 頁面。

③ Lint

スクリーンショット 2026-05-26 11.10.25.png

  • 透過定期健康檢查,修正矛盾與孤立頁面。
  • 定期找出矛盾、過時的主張、孤立頁面、缺少的交叉引用,以及需要額外調查的資料缺口等問題。

索引與日誌

隨著 Wiki 成長,有兩個特殊檔案能幫助 LLM(以及人類)瀏覽整個 Wiki。

index.md

スクリーンショット 2026-05-26 9.52.57.png

  • 包含每個頁面的連結、一行摘要,以及(可選)日期、來源數等中繼資料的 Wiki 全頁目錄。
  • 依類別(實體、概念、來源、...)整理。
    • 每次匯入(Ingest)時由 LLM 更新。
    • 在問答(Query)時,LLM 會先讀取這個 index.md 找出相關頁面,再深入查閱。

log.md

スクリーンショット 2026-05-26 9.53.28.png

  • 以追加寫入(append-only)方式記錄「什麼時候發生了什麼事」的檔案。
  • 匯入(ingest)、問答(query)、lint 等所有事件都會按時間順序留下紀錄。
    • 若讓每筆記錄都以一致的前綴開頭,就能像 grep "^## \[" log.md | tail -5 這樣,用簡單的 Unix 工具解析。
      • 前綴範例:## [2026-04-02] ingest | 文章標題
    • 這能讓人掌握 Wiki 演進的時間線,也能幫助 LLM 了解「最近做了什麼」。

使用的工具

スクリーンショット 2026-05-26 9.53.52.png

  • Wiki 檢視器
    • Obsidian、VS Code、...
  • LLM 代理人
    • Claude Code、Codex、...

結論:什麼是 LLM Wiki

這是一個會越用越聰明、越整理越有價值的「活的知識庫」。

RAG 的適用情境

【觀點】

觀點 適合 RAG 適合 LLM Wiki
資料更新頻率 中~低
資料規模 數千~數百萬 數百
知識性質 事實查詢 概念理解、整合
想要的答案 「原始資料裡寫了什麼」 「綜合多份資料後,可以得出什麼結論」

【具體例子】

具體例子 RAG or LLM Wiki
個人學習・研究 LLM Wiki
企業內部文件搜尋 RAG
FAQ RAG

正在尋找一起思考新技術社會實作的夥伴

感謝你讀到最後!
我想我們大概很合拍。

目前我們公司正在招募能一起寫程式、一起抓頭苦思、成功時也能彼此喝采的工程師。
就算只是「想先聊聊看」也完全沒問題!我們反而非常歡迎。

Sapeet 招募資訊


原文出處:https://qiita.com/shinnosuke_takami/items/86307593829ac5e70852


精選技術文章翻譯,幫助開發者持續吸收新知。

共有 0 則留言


精選技術文章翻譯,幫助開發者持續吸收新知。
🏆 本月排行榜
🥇
站長阿川
📝12   💬4   ❤️1
464
🥈
alicec
📝1   ❤️2
87
#4
我愛JS
💬1  
3
評分標準:發文×10 + 留言×3 + 獲讚×5 + 點讚×1 + 瀏覽數÷10
本數據每小時更新一次
📢 贊助商廣告 · 我要刊登