晚上好。這裡是坐禪犬。
Claude Code、Gemini CLI、Cursor,以及Kiro,真的讓我們開始覺得沒有AI代理的生活難以想像。起初我只是抱著好奇,想知道可以做些什麼,但隨著我漸漸有了自己的運作架構,這些工具變成了生活的必需品。正如那句名言所說,「我們創造了工具,而後工具塑造了我們。」我深刻感受到,這些技術正徹底改變著我們的生活。
最近,經營分析和調查業務的效率化成了日常工作的迫切需求。雖然通過整合各種AI工具,我已經實現了一定的效率提升,但仍未能達到理想狀態。在上個月中旬的LT會上,我曾提到透過Obsidian作為上下文倉庫,更加自主的運作模式是必須的。
在這樣的背景下,我進行了一個挑戰:試著用GeminiCLI透過markdown來控制,以重現Deep Research的過程。通過這種方式,我感受到了用Vault內部搜尋資訊的靈活性,能夠比RAG更便利地取得資訊和引入上下文。
因此,我開始思考是否可以將像Claude Code這樣的編碼代理應用於更通用的研究、分析業務和經營等領域,並進行關於AI代理的「協作」所帶來的新業務自動化的驗證。
僅僅讓AI代理進行簡單工作的「自動化」,其實只是在替代人類。乍聽之下,這意味著它們只在做人類能做到的工作,並沒有創新性。但如果能將自身的思考和判斷過程移植到代理身上,實現「複製自己」,那麼將會產生獨特的價值。我們都希望實現這一點。
這裡的關鍵在於「連續性」和「自律性」。也就是說,如果有具備理解人類意圖和上下文(Context)的能力,並且能夠自主判斷和執行的代理,那麼,將會創造出與過去自動化不同的新價值。
如今,對AI代理抱有類似人類的彈性判斷期望還是有些困難,因為這缺乏連續性,所以無法看出判斷的收斂。現今的LLM已經非常聰明,可以說人類中就算再厲害的人也不過如此。
根據這一點,我提出了「通過施加嚴格的規則,實現基於上下文的自律性」的假設。
我把作業過程分解為「輸入 → 參考的情況和限制 → 基準參考 → 決策 → 執行 → 責任與驗證」,在每個階段定義代理應遵循的規則。這是希望能夠模擬人類判斷的嘗試。其實這與最近的代理在明確定義需求及規格、任務清單時,能更順利地進行代碼生成的情況是一樣的。
這次,我選用用戶知識豐富的Claude Code代理,定義了以下規則,並在實際業務中進行驗證。
為了控制代理的行為,我在名為CLAUDE.md
的文件中記錄了以下規則:
這一運作模式旨在實現「AI自主執行任務,而人類則負責確認和方向修正」的合作體制。這與Pomodoro技巧相結合,預想人類在25分鐘時集中精力工作,5分鐘內進行回顧。
說實話,我自己是牙醫,因此這就是我日常工作的樣貌。
我將這一模式在工作和個人生活中充分利用。
解決的課題
我想在Manabi DX Quest上,舉辦一個讓大家輕鬆學習編程的自主活動。有什麼好的主意嗎?想到了!舉辦一個開發補助學習工具的活動如何?
請求ClaudeCode
諮詢解決課題的過程,然後將任務分配到日程中
ClaudeCode在Vault內搜尋,並生成調查請求書
通過wikilink整理的文件,引用起來非常方便。
將調查請求書複製到ChatGPT Deep Research並進行調查
透過對話、調查,並不時進行返修,最終完成了幻燈片的製作
受講者社群並不多,不過也無所謂。最後25分鐘我在打盹,不過內容上我(除了睡覺前簽的部分)全都有掌控,若有與我想法不符的地方,有逐一進行修正。修正越快,越能減少修改的量,方向也能清晰把握。重要的信息都是我自己的語言。
解決的課題
本業的業務改善課題(因具體內容過於敏感無法截圖)
解決方案的提案
制定解決方案和路線圖。請將其記錄在日程中並開始。
本質問題的鑑定
讓Vault從馬克down化的手冊或經營分析中進行Deep Research式探索。
解決方案的建議
對說服力薄弱的部分,請求其調查類似案例。
改善手冊的草案
從Vault獲取相鄰領域的手冊,效仿格式編寫新的手冊。
應用程序的原型設計
想想這才是我的本業!
提案幻燈片的製作
利用Marp完成了非常清晰的幻燈片。
成果:
課題:
透過本次驗證,我發現利用Obsidian作為上下文倉庫加上文件共享系統,並在嚴格規則的基礎上控制AI代理,有望實現高難度的研究業務和報告的半自動化。
如盧梭所說的:「完全的自由只能通過最嚴格的紀律來實現」,AI代理的高性能意味著如果自由過於廣泛,反而難以駕馭。只有通過人類對嚴格規則的定義及定期檢查,才能最大限度發揮其潛能,使我們的模仿性智識存在站上更高的舞台。我感覺到這樣的「協作」未來就在不遠處。
下次我會將具體的CLAUDE.md或AGENTS.md內容,以及幾個代理行為的比較整理分享出來。
感謝眾多的人閱讀和反饋。再次感謝你們。同時,我在CDLE浩志的會議中也發表了相同的內容,大家的討論相當熱烈,並且提問極具啟發性。我希望能讓更多人體驗到我認為不錯的東西,因此,目前的CLAUDE.md也將公開。
建立作業文件夾規則使得Claude Code的規則控制變得非常有趣,因為我們可以為每個作業文件夾設置規則文件。歡迎大家創建可進行實驗的文件夾(當然,Obsidian的vault是最理想的!),歡迎你們將CLAUDE.md複製並創建出來,操作Claude Code試試。
<details><summary>CLAUDE.md</summary>
# 工作指導原則
## 30分鐘自動任務執行(HITL方法)
### 基本循環
1. **日程檢查**(開始時)
- 閱讀markdown格式的日程
- 制定30分鐘的工作計劃
2. **任務執行**(25分鐘)
- 根據日程執行任務
- 在人類能驗證的1-5分鐘內進行工作
3. **報告創建**(5分鐘)
- 記錄已完成的任務、正在進行的任務和問題
- 指定下30分鐘的計劃
### 表現記錄方法
在日程文件的每個時段直接記錄:
- **完成**:已完成的內容和結果
- **問題**:遇到的問題或待決策事項
- **變更**:與原計劃的變更
### 日程表表現錄製格式
```markdown
**表現:**
- (完成內容和結果)
- 參考文件:
- [[文件名]]
評論(人類):(人類提供修改說明或補充信息)
- [ ] 人類驗證
- [x]
,則不得進行下一任務- [ ] 人類驗證
或- [x] 人類驗證
的行在開始新的時間段工作之前,必須總是執行以下步驟:
檢查日程文件中的上一時間段
- [x] 人類驗證
當驗證未完成時的反應
- [ ] 人類驗證
,停止工作在驗證完成後開始工作
- [x] 人類驗證
後開始工作在不例外的情況下應用這一規則,以防錯過驗證
每個時間段開始時必須進行口頭確認:
明確的驗證檢查
時段的待辦清單結構
任何時段必需的第一項待辦:
- [ ] 已確認前一時間段的驗證
- [ ] (只有在確認後)開始主要任務
任何時段必需的最後一項待辦:
- [ ] 已完成日程表表現錄製
驗證失敗流程
當發生錯誤或規則違反時:
立即停止並分析
根本原因分析報告(必需)
## 錯誤報告
- **違規規則**:[具體違反的規則]
- **發生了什麼**:[對錯誤的事實描述]
- **直接原因**:[違規的即時原因]
- **根本原因**:[潛在的系統性原因]
- **預防措施**:[防止再次發生的具體行動]
錯誤日誌文檔(強制)
/claude/error_log.md
預防措施實施要求
模式識別
/claude/schedules/YYYY-MM-DD.md
格式放置/claude/schedules/2024-01-15.md
(根據日本時間)- [ ]
核查框範例:
# YYYY-MM-DD 日程
## 今天的任務
### 任務1
- **內容:** [在此輸入]
### 任務2
- **內容:** [在此輸入]
### 任務3
- **內容:** [在此輸入]
## 任務細分與時間分配(供人類確認使用)
<!--
開始工作時,細分上面的任務並記錄如下:
- 每個任務的工作流程
- 預估所需時間
- 日程分配建議
-->
該計劃是否可接受?如獲批准,將從09:00開始執行。
**一旦工作流程確定,AI代理應將日程轉移到以下日程中**
- [ ] 人類驗證
---
## 14:00-14:30
- [ ] **安排的任務:**
- 創建自費治療商業流程圖
**表現:**
- (在工作完成後填寫)
- [ ] 人類驗證
- [x]
- [x]
/claude/
目錄中創建
{調查主題}_調查請求.md
(使用日文書寫)---
tags:
- ClaudeCode
- 調查請求
- DeepResearch
- [相關標籤]
date: YYYY-MM-DD
updated: YYYY-MM-DD
title: {調查主題}調查請求
---
# {調查主題}的Deep Research調查請求
## 調查目的
{清楚地陳述為何需要進行此調查及其期望成果}
## 調查背景
{目前狀況、已知資訊、挑戰等}
## 調查項目(結構化)
### 1. 基本信息收集
- [ ] {特定調查項目1}
- [ ] {特定調查項目2}
- [ ] {特定調查項目3}
### 2. 詳細分析
- [ ] {分析角度1}
- [ ] {分析角度2}
- [ ] {分析角度3}
### 3. 比較/評估
- [ ] {比較項目1}
- [ ] {比較項目2}
- [ ] {評估標準}
### 4. 實用信息
- [ ] {實施方法/流程}
- [ ] {注意事項/風險}
- [ ] {成功案例/失敗案例}
## 預期成果
1. **調查摘要**(1-2頁)
- 主要發現
- 重要見解
- 建議措施
2. **詳細報告**
- 每個調查項目的詳細結果
- 數據/統計信息
- 參考材料清單
3. **可行性提議**
- 具體行動計劃
- 優先級
- 時間表
## 調查中的重要視角
- 優先考慮可靠的信息來源
- 重視最新資訊({當前年份}數據)
- 考慮實際應用性
- 從多個視角進行分析
## 調查結果記錄部分
(在此粘貼ChatGPT Deep Research的結果)
## 下一步執行計劃
一旦調查結果提供,將繼續{原始任務名稱}。
通過管理等待人類輸入的任務來最大限度提高生產力,而不會阻礙其他工作。
當需要信息時:
1. 創建信息提供請求(情報提供依頼)
2. 立即加入/claude/pending_tasks.md
3. 在日程中將當前任務標記為「待處理」
4. 切換至下一個可用任務
### [任務名稱]
- **狀態**:🟡 等待信息
- **請求文檔**:[[請求文件鏈接]]
- **請求日期**:YYYY-MM-DD HH:MM
- **阻塞原因**:[具體所需信息]
- **恢復所需**:[所需項目清單]
- **下一步行動**:[解除阻塞後的行動]
- **優先級**:高/中/低
檢查週期(每30分鐘):
1. 檢查pending_tasks.md
2. 查看是否有請求文檔的回應
3. 如果提供了信息 → 恢復任務
4. 如果仍在等待 → 繼續其他任務
/claude/{調查主題}_調查請求.md
中創建/claude/research/
pdftotext
命令從PDF中提取文本[[PDF文件名]]
# Extract text from PDF (requires poppler-utils)
pdftotext "/claude/research/Investigation_Report.pdf" -
/claude/{調查主題}_調查請求.md
/claude/research/{調查主題}_調查報告.pdf
[[PDF文件名]]
### 調查結果摘要(於YYYY-MM-DD進行)
#### 1. [主要類別1]
- [關鍵點1]
- [關鍵點2]
#### 2. [主要類別2]
- [關鍵點1]
- [關鍵點2]
### 詳細報告
完整版本包含在[[Investigation_Report.pdf]]
/claude/
目錄中創建
{任務名稱}_情報提供依頼.md
(信息提供請求)/claude/
目錄中創建
{創建的項目名稱}.md
(使用日文書寫)[[文件名稱]]
)---
tags:
- ClaudeCode
- 情報提供依頼
- [相關標籤]
date: YYYY-MM-DD
updated: YYYY-MM-DD
title: {任務名稱} 情報提供依頼
---
# {任務名稱}的信息提供請求
## 任務概述
- **任務名稱**:{任務名稱}
- **預定時間**:YYYY-MM-DD HH:MM-HH:MM
- **狀態**:因信息不足而暫時暫停
## 調查結果
### 已發現的現有材料
(列出調查過程中找到的相關材料)
### 缺失文件
(為每個必要信息創建節點)
#### 1.{缺失信息標題}
**所需信息**:
- [ ] {所需項目1}
- [ ] {所需項目2}
**錄入部分**:
(在此填入相關信息)
## 下一步執行計劃
一旦提供上述文件信息,將執行{任務名稱}。
/claude/
目錄ClaudeCode
[[文件名稱]]
[[經營分析數據]]
/research/dental-clinic-analysis/management_analysis.csv
/claude/
├── schedules/ # 日程文件
├── outputs/ # Claude生成的文檔
│ ├── YYYY-MM-DD_ProjectName_Theme/ # 項目文件夾
│ │ ├── Investigation_Request.md
│ │ ├── Basic_Concept.md
│ │ └── Proposal.md
│ └── [其他項目]/
└── research/ # 全部通用研究材料(所有PDF)
└── Investigation_Report.pdf
YYYY-MM-DD_ProjectName_SpecificTheme
2025-08-24_ManabiDXQuest_AppDevelopmentEvent
/claude/outputs/{項目文件夾}/Investigation_Request.md
/claude/outputs/{項目文件夾}/
/claude/research/
(所有通用)<!-- 評論、修改指示、額外請求 -->
最低限度的打字以提高效率
_v1.md
、_final.md
等)