=========================================================================================================================================================================================================================================================================================================================================================================
想把大型的需求定義書或規格書(例如數百頁的 PDF)交給 AI 閱讀,並自動從中產出系統設計書或提案書等新文件。
通常如此龐大的文件無法由 AI 一次處理完畢。但結合文件導向型 AI「NotebookLM」與 AI 原生 IDE「Antigravity」,就能將龐大的 PDF 有效率地重構為 Markdown 的專案群,讓 AI 代理人完整掌握規格內容後再進行文件產出。
本文示範如何做到「有一個超大型 PDF,請幫我解析並產出這樣的文件」,並附加實務性的工作流程,直到將最終提交格式 Word 檔(.docx)匯出為止。
本次示範使用的範例 PDF 為日本數位廳公開的「調達仕様書等の概要(2026年3月6日版)」。來源:日本數位廳官方網站。
以下簡要說明本文中作為文件管理核心的兩項技術。
首先準備好作為基底的 IDE 環境。
若把大型 PDF 一次要求 NotebookLM 輸出完整 Markdown,容易因輸出 token 上限而中斷。解法是先請 AI 產生分割指示清單,再依序處理各段落。
步驟:
請閱讀內容,並為了避免觸及 token 限制,將可以安全輸出的文字量切分成多個段落,輸出一個「Markdown 化指示清單」,每項指示描述要將 PDF 的哪一部分轉成 Markdown(例如:「第 1 章〜第 2 章」或「附錄 A」等)。
(介面截圖省略)
在每個輸出的最後通常會有複製按鈕,按下後貼到 Antigravity 的 Markdown 檔即可。
將多個 Markdown 檔放入 Antigravity 專案後,可使用 Antigravity 的 Agent 功能來建構與修改文件。
在聊天欄以自然語言下達指示,例如:
以本調達規格書的目錄為基礎,請新建一份關於政府雲端整合部分的 API 設計書。
Agent 會概覽專案內容,自動產出或修正文件以保持一致性。人員主要負責審核內容與向 Agent 提供指示。
在檔案上按右鍵可以預覽文件。
PDF 中的圖表可依用途採兩種方式匯入 Antigravity。
在 NotebookLM 的 PDF 預覽中,對目標圖按右鍵複製,然後在 Antigravity 編輯器中直接貼上。這個動作會自動將圖片存成檔案,並在 Markdown 中產生連結。
對於業務流程或時序圖等具結構性的圖,建議轉成 Mermaid 程式碼以利維護:
完成後,Antigravity 的預覽會渲染出 Mermaid 圖。若需修改,只要用自然語言告訴 Agent,例如「請在這個 Mermaid 圖的認證流程中加入使用 My Number 卡(個人號碼卡)的流程」,Agent 會精準地修改程式碼。
至此,連原本只能從圖中取得的資訊也能被 AI 問答或指示使用。
若最終需提交 Word 格式,以下在 Antigravity 中建立 Markdown → Word 的一鍵轉換環境。
需安裝用於生成圖像的 Node.js(npx)與用於轉檔的 Pandoc。
# 安裝 Node.js
winget install OpenJS.NodeJS
# 安裝 Pandoc
winget install JohnMacFarlane.Pandoc
若無法使用 winget,或想以安裝程式(.msi)以 GUI 安裝,下面那篇 Qiita 教學整理得相當詳細,可作為參考:
👉 Pandoc 的比較簡單安裝方法(@sky_y)
brew install node
brew install pandoc
sudo apt update
sudo apt install nodejs npm pandoc
為避免輸出格式錯誤,請在目標 Markdown 檔案的最開頭(第 1 行)加入下列 Front Matter:
---
output: word_document
---
背景作業會由 npx 先將 Mermaid 轉成圖片,最後在同一目錄輸出 Word 檔(.docx)。