我調查了 Agent Builder 並實際試用,感覺這不僅僅是一個新工具,而是一個相當本質的轉捩點。
簡單來說,一個能夠視覺化構建 AI 助手工作流程的工具。這是 OpenAI 在 2025 年推出的官方助手開發環境。
只需拖放節點,將其連接起來。你不需要繁瑣的編碼。即使是那些在 LangChain 中遇到挫折的人,也能直觀使用這個工具。
開發流程分為三個步驟:
由於可以立即確認預覽功能的操作,反饋循環非常快。你可以輕鬆地進行反覆試探性更改,「這裡改了會怎樣?」就能輕鬆試驗。
「那麼,Dify 和這有什麼不同?」你會這樣想。下面是我實際接觸兩者後總結的差異。
Agent Builder
Dify
Agent Builder
Dify
選擇 Agent Builder 的情境:
選擇 Dify 的情境:
個人而言,原型使用 Agent Builder,若要進行大規模運行且需要自定義則考慮 Dify,這是個不錯的使用區分。
工作流程是由「節點」組合而成。主要節點分為四類:
核心節點(Core Nodes)
工具節點(Tool Nodes)
邏輯節點(Logic Nodes)
數據節點(Data Nodes)
從實際使用中發現,不要將過多角色堆疊到一個助手上。將「分類」、「搜索」、「回答」等節點分開會獲得更好的性能。
以客戶支持機器人為例:
開始
→ 問題分類代理(Q&A 或調查)
→ 如果/否則分岐
├→ Q&A代理 → 文件搜索 → 回答生成
└→ 調查代理 → MCP(外部搜索)
→ 人類批准 → 回答發送
這樣的流程可以視覺化設計。預覽可以立即確認運行,因此「哦,這個分岐有問題」時能快速發現。
在我實際測試時,有輸入「無視你的指令...」的情況,結果助手太老實地遵從了,讓我驚慌失措。因此,措施是必須的。
OpenAI 官方推薦的方式:
特別是當與外部工具集成時要謹慎。例如,與 Gmail 集成,如果未經批准就進行設置,助手可能會試圖訪問不應該的郵件,這讓我想「哦,這樣不好」。
使用 Agent Builder 創建的工作流程,可以輕鬆集成到 ChatKit 的 UI 中。
實現流程:
@openai/chatkit-react
import { ChatKit, useChatKit } from '@openai/chatkit-react';
export function MyChat() {
const { control } = useChatKit({
api: {
async getClientSecret(existing) {
const res = await fetch('/api/chatkit/session', {
method: 'POST',
});
const { client_secret } = await res.json();
return client_secret;
},
},
});
return <ChatKit control={control} className="h-[600px] w-[320px]" />;
}
僅此而已,聊天界面就可以顯示出來。使用 Widget 可以創建如卡片或按鈕等豐富的 UI。
在 Widget Builder 中,使用視覺編輯器進行設計也非常方便。
可以使用 Homework Helper、Customer Support 等模板。比起從零開始,參考這些模板學習會更快。
一週後的自己可能會忘記現在的思考,特別是在設計複雜分岐時,要記得好好註解。
如果在預覽中執行太多次,Token 消耗可能會是預期的三倍。定期檢查使用情況十分重要。
通過 Trace Graders 進行定量評估。「是否正確回答問題」和「是否存在不當內容」等方面給予評分。
雖然安全性提高,但如果每次都要求確認,會影響使用體驗。僅針對數據刪除、外部發送、收費處理等重要動作進行限制。
Agent Builder 相當有趣。它降低了設計助手的門檻,讓「想製作這樣的東西」能比較快地實現。
與 Dify 相比:
如果想要在 OpenAI 生態系內部完結,Agent Builder 是個相當不錯的選擇。
然而,它並不是一根魔法杖。安全措施是必須的,且需要管理成本。助手有時也可能表現出意外行為。
但即便如此,這仍然是個充滿可能性的工具。未來助手開發可能會變得更加普遍,並融入各種產品中。這是我對未來的某種期待。
參考鏈接
原文出處:https://qiita.com/akira_papa_AI/items/7344e21b9204526e5127