AI Agent 對比和選型

一、前言

!!!Agent,把天才 AI 變成一個能幹活的人 !!!

如果說 LLM 大模型是一個天才引擎,那麼 Agent 就是很多無形的手,去控制這個天才引擎完成各種各樣的工作和流程,替人類真正地幹好活。

Agent 圈的主流產品/框架,如同百家爭鳴般,賽道分化明顯、定位涇渭分明:

  • 有開箱即用的,可本地部署、多渠道接入的個人助理產品,最典型的就是 OpenClaw🦞
  • 有適合生產落地的底層 Agent 編排框架,面向開發者/企業,自研複雜多智能體,比如:LangGraph
  • 有高度產品化,內置於大廠應用;深度綁定自家模型,擁有工具調用、程式碼工程、終端任務能力的Agent 協作平台。比如大家都在用的:Claude Code、Gemini、Codex

下面我們就深入學習這些 Agent 的核心能力和應用場景!

二、概覽

流派 產物形態 應用場景 代表
開箱即用型 可部署的完整應用 個人 / 團隊 Agent 助理 OpenClaw、ZeroClaw、Dify
編排框架 SDK / 函式庫 自研複雜多智能體 LangGraph、CrewAI
產品工具型 CLI / IDE 開發者編碼、終端自動化 Claude Code、Codex、Gemini Cli
功能定位 集成成本 控制粒度 使用難度 擴展性 安全性
開箱即用型 端到端任務執行 中低 中高
編排框架 自建 Agent 編排
產品工具型 工程現場協作 極低

本文我們核心了解:OpenClaw、ZeroClaw、LangGraph、Codex、Claude Code

三、成品化 Agent 應用

這類 Agent 的特點是:你不需要寫程式,部署好就能用。它們是完整的應用,開箱即用。

1. OpenClaw 🦞(368k★)

核心亮點

  • 本地優先的 AI 閘道:所有資料留在本地,隱私可控
  • 25+ IM 平台接入,意味著你可以在社群軟體上直接下達指令:微信、QQ、飛書、iMessage、WhatsApp、Telegram、…… 幾乎是全渠道觸達
  • 語音能力:macOS/iOS 支援喚醒詞,Android 支援連續語音對話(ElevenLabs + 系統 TTS)
  • Live Canvas:Agent 驅動的視覺化工作台(A2UI),不只是聊天框
  • 多 Agent 路由:不同渠道可以路由到不同 Agent workspace,彼此隔離

部署步驟

bash 体验AI代码助手 代码解读复制代码# 安裝(Node.js 22.14+ / 建議 24)
npm install -g openclaw@latest

# 引導式初始化(選模型 provider、接入渠道、配安全)
openclaw onboard --install-daemon

# 檢查配置健康度
openclaw doctor

支援 npm / pnpm / bun,也支援 Nix 和 Docker 部署。
不挑模型 Provider —— 用你偏好的旗艦模型(Claude / GPT / Gemini / DeepSeek 等)。

安全機制

  • DM 配對:陌生人發訊息需要輸入配對碼才能與 Agent 互動
  • 會話隔離:非主會話強制在沙箱中執行
  • openclaw doctor:一鍵稽核配置安全性

常見玩法

  1. 全渠道個人助理:行程、郵件、待辦、知識庫問答,只要在 IM 平台上 @它就行
  2. 團隊自動化 Bot:監聽 GitHub / GitLab 事件 → 自動處理 → 群組裡回報

總結:OpenClaw 是「Agent 界的 Homebrew」—— 生態決定了它能幹多少事,本地優先保證了你的資料不出門。

2. ZeroClaw 🦀(31k★)

核心亮點

  • 單 Rust 二進制極致輕量,最小核心僅 6.6MB,冷啟動極快
  • 安全第一:預設 supervised 模式,OS 級沙箱(Linux Landlock / Bubblewrap / macOS Seatbelt / Docker),每次工具呼叫都有密碼學簽章收據,可稽核
  • 20+ 模型 Provider:Anthropic、OpenAI、Ollama、任何 OpenAI 相容端點,支援 fallback 鏈和智慧路由
  • 硬體 IoT 整合:GPIO / I2C / SPI / USB,支援樹莓派、STM32、Arduino、ESP32
  • SOP 引擎:事件驅動的標準作業流程(MQTT / Webhook / Cron / 外設觸發),支援審批門和可恢復執行

部署步驟

bash 体验AI代码助手 代码解读复制代码# 一鍵安裝
curl -fsSL https://raw.githubusercontent.com/zeroclaw-labs/zeroclaw/master/install.sh | bash

# 或從原始碼編譯(支援自訂 features)
git clone https://github.com/zeroclaw-labs/zeroclaw.git
cd zeroclaw && ./install.sh --source --features "telegram,ollama,gpio"

# 最小安裝(僅核心,6.6MB)
./install.sh --minimal

配置檔:~/.zeroclaw/config.toml單一檔案就可以管理全部配置,非常方便

技術架構

應用場景

  1. 邊緣 AI / IoT:在樹莓派上 7×24 跑 Agent,透過 GPIO 控制硬體
  2. 高安全環境:密碼學收據 + OS 沙箱,適合金融 / 醫療合規場景
  3. 終端裝置:Windows、Android(ZeroClaw-Android)整機裝置的 Agent 總控

ZeroClaw 是「Agent 界的嵌入式 Linux」—— 極致輕量 + 硬體級安全 + IoT 原生,在資源受限環境裡它是唯一選擇。

3. OpenClaw vs ZeroClaw

維度 OpenClaw 🦞 ZeroClaw 🦀
語言/執行環境 Node.js Rust 單二進制
最小體積 ~100MB+ 6.6MB
生態規模 368k★,ClawHub 技能豐富 31k★,相容部分 OpenClaw Skills
安全模型 DM 配對 + 沙箱 密碼學收據 + OS 級沙箱
硬體支援 GPIO/I2C/SPI/USB
適合場景 個人/團隊全渠道助理 終端裝置 / IoT / 高安全環境
Windows WSL2 WSL2

選型建議:資源充足、追求生態 → OpenClaw;資源受限、安全優先、要碰硬體 → ZeroClaw。

4. 插入講解下,最近很火的 Hermes 框架

Hermes Agent(132k★)

Nous Research 出品—— "The Agent That Grows With You"
核心理念:Agent 不該是靜態的,它的 Skills、Prompts、程式碼應該隨使用持續自我最佳化、成長學習

技術框架

核心抽象:

  • Skills(程式記憶) :Agent 完成複雜任務後自動提取可重複使用 Skill,下次直接呼叫
  • Persistent Memory:使用者輪廓 + 會話歷史 + 長期知識,跨會話保留
  • Subagent 並行:spawn 隔離子 Agent 並行處理子任務
  • Cron 排程器:內建定時任務,Agent 可自主設定週期性工作
  • 六種執行後端:Local / Docker / SSH / Daytona / Singularity / Modal

技術特點和優勢

  • 自我進化的 Skills:任務完成後自動建立 Skill,使用中自動改進
  • Self-evolution:DSPy + GEPA(遺傳帕累托提示進化,ICLR 2026 Oral),純 API 呼叫無需 GPU,單次 $2-10
  • 模型無關:OpenRouter 200+ 模型、OpenAI、Anthropic、NVIDIA NIM、Ollama
  • 多平台閘道:Telegram / Discord / Slack / WhatsApp / Signal / Email,單進程多渠道
  • 40+ 內建工具 + 原生 MCP 擴充
  • FTS5 會話搜尋:全文檢索 + LLM 摘要
  • ⚠️ Self-evolution 仍在早期:Phase 1 已實現,Phase 2-5 規劃中

安裝和上手

bash 体验AI代码助手 代码解读复制代码# 一鍵安裝
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
source ~/.bashrc

# 互動式配置
hermes model    # 選擇 LLM provider
hermes tools    # 配置可用工具
hermes setup    # 完整設定嚮導

# 啟動
hermes          # CLI 聊天
hermes gateway  # 多渠道閘道

Self-evolution 工作原理

markdown 体验AI代码助手 代码解读复制代码日常使用 → 完成任務 → 自動建立/改進 Skill
    ↓
觸發 Self-evolution(手動或定時)
    ↓
DSPy 收集回饋 → GEPA 遺傳演算法搜尋最優方案
    ↓
帕累托篩選(準確性 × 效率 × 成本)
    ↓
最優變體替換原 Skill → Agent 變得更聰明

適合的場景

  1. 持續最佳化的 AI 助手:越用越順手,不需要手動調 prompt
  2. 多渠道營運:一個程序同時服務多個平台
  3. Serverless 彈性:Modal/Daytona 按需休眠
  4. 研究探索:Self-evolution 本身就是很好的研究工具

Hermes 是「會長大的 Agent」—— 你用它,它也在學你。Self-evolution 是它最大的護城河。

四、Agent 編排底層框架

這類框架解決的核心問題是:我要在自己的產品裡做一個 Agent,但不想從零實作調度、狀態管理、工具註冊這些雜事。
換言之:你的業務邏輯才是核心,框架幫你搞定「讓 AI 按流程幹活」這件事。

1. LangGraph(31.2k★)

LangChain 團隊出品,靈感來自 Google Pregel、Apache Beam 和 NetworkX——用 有向圖 來編排 Agent 的工作流程。控制粒度最細的 Agent 框架,沒有之一。

技術框架

三個核心抽象:

  • Node(節點) :每個節點是一個處理步驟—— LLM 呼叫、工具執行、或任何 Python/TS 函式
  • Edge(邊) :節點之間的轉換邏輯,支援條件路由
  • State(狀態) :跨節點共享的上下文,自動持久化,程序掛了也能從斷點恢復

語言支援:Python(langgraph)+ TypeScript(langgraphjs)雙版本。

技術特點和優勢

  • 顯式可控:每個決策分支都是程式碼裡的一條邊,不存在「LLM 自己決定下一步」的黑盒
  • 持久化執行:State 自動持久化到 Postgres / Redis / SQLite,程序崩潰可從 Checkpoint 恢復
  • Human-in-the-loop:任意節點可插入人工審批,Agent 暫停等人確認後繼續
  • Time-travel 除錯:回溯到任意歷史 State 快照,重放執行路徑
  • 可觀測性:深度整合 LangSmith,每一步 token 消耗、延遲、決策路徑全可追蹤
  • 長期記憶:支援短期工作記憶 + 跨會話長期持久記憶
  • ⚠️ 學習曲線陡:StateGraph / MessageGraph / Pregel 多種抽象,新手容易迷失
  • ⚠️ 生態綁定:雖然可獨立使用,但強引導走 LangChain + LangSmith 全家桶

典型程式碼示例

python 体验AI代码助手 代码解读复制代码from langgraph.graph import StateGraph, END
from typing import TypedDict

# 1. 定義狀態
class AgentState(TypedDict):
    messages: list
    next_action: str

# 2. 定義節點函式
def analyze(state: AgentState) -> AgentState:
    ...

def execute(state: AgentState) -> AgentState:
    ...

# 3. 組裝圖
graph = StateGraph(AgentState)
graph.add_node("analyze", analyze)
graph.add_node("execute", execute)
graph.add_node("review", human_review)

# 4. 條件路由
graph.set_entry_point("analyze")
graph.add_edge("analyze", "execute")
graph.add_conditional_edges(
    "execute",
    lambda s: s["next_action"] == "need_review",
    {True: "review", False: END}
)

# 5. 編譯(帶持久化)
app = graph.compile(checkpointer=PostgresSaver(...))

接入流程

需求分析 
 ↓
定義 State Schema 
 ↓
編寫 Node 函式 
 ↓
定義 Edge 路由邏輯 
 ↓
組裝 StateGraph 
 ↓
配置 Checkpointer(Postgres/Redis)
 ↓
部署(LangGraph Cloud / 自架)
 ↓
接入 LangSmith 監控

適合的場景

  1. 企業級審批流程:貸款審批、內容審核、風控決策——每一步可追溯
  2. 客服系統:意圖識別 → 檢索 → 工具呼叫 → 人工升級,精確控制
  3. 資料處理 Pipeline:ETL + AI 分析 + 人工確認的混合流程
  4. 多步推理:需要 Human-in-the-loop 的複雜分析場景

LangGraph 是「Agent 界的狀態機」—— 你畫什麼圖,Agent 就走什麼路。確定性最強,學習成本也最高。

五、內建 Agent 能力的大廠應用

這是研發同學最熟悉的,我們日常就在用 Codex、Claude Code、Gemini 等進行 AI 編碼。
這些工具都深度綁定自家模型,內建了很垂直的任務規劃、工具呼叫、終端維運等 Agent 場景,無需依賴第三方框架即可直接使用智能體能力。
本質上,這些工具自帶 Agent —— 且透過 MCP 協議,你的專案還能反向呼叫它們的能力。

1. Codex(80k★)

定位:OpenAI 開源的終端 Agent,"Lightweight coding agent that runs in your terminal"。
安裝方式

bash 体验AI代码助手 代码解读复制代码npm install -g @openai/codex
# 直接下載桌面應用也可以

使用最佳實踐

  • 全自動模式codex "重構這個函式並加上單元測試" → Agent 自動規劃、修改、驗證
  • 審批模式(推薦) :每一步操作需確認後才執行,適合生產程式碼
  • 沙箱隔離:所有檔案操作在沙箱內執行,不會直接污染工作目錄

模型支援

  • 預設 GPT-4.5(推薦)
  • 支援 o3、o4-mini 等推理模型
  • 透過環境變數可切換模型:OPENAI_MODEL=o3 codex "..."

多會話管理

  • 支援 --resume 恢復上次會話
  • 專案級上下文:自動讀取 AGENTS.md / codex.md 作為專案指令

MCP / Skills 管理

  • 原生支援 MCP(Model Context Protocol),可接入外部工具
  • 透過 codex.md 配置專案級 instructions 和工具權限
  • 支援自訂 approval 規則:哪些操作自動執行、哪些需審批

2. Claude Code(120k★)

定位:Anthropic 官方 CLI Agent,目前生態最完整、社群最活躍的編碼 Agent。

安裝方式

bash 体验AI代码助手 代码解读复制代码npm install -g @anthropic-ai/claude-code

使用最佳實踐

  • Plan → Execute 分離:複雜任務先讓它出計畫(/plan),確認後再執行
  • Sub-agent 並行大任務自動拆分成多個子 Agent 並行處理
  • Skills 系統:把常用操作封裝成 Skill,一鍵重用(如「寫飛書文件」、「產生 PR」)

模型支援

  • 預設 Claude Opus 4(最強推理)
  • 支援 Sonnet 4 / Haiku 4(快速模式 /fast
  • 透過 /model 指令或 CLAUDE_MODEL 環境變數切換

多會話管理

  • 自動上下文壓縮:對話可無限長,系統自動管理
  • /resume 恢復歷史會話
  • 支援多 workspace 並行:每個專案獨立上下文
  • 背景 Agent:run_in_background 讓 Agent 在背景跑長任務

MCP / Skills 管理

  • MCP 雙向通道
    • 作為 MCP Client:接入飛書、GitHub、資料庫等外部工具
    • 作為 MCP Server:讓其他應用呼叫 Claude Code 的能力(讀程式碼、改檔案、跑命令)
  • Skills 生態.claude/skills/ 目錄管理專案級技能
  • 權限體系.claude/settings.json 精細控制工具權限
  • Hooks:在工具呼叫前後自動執行自訂腳本

3. Codex vs Claude Code

維度 Codex Claude Code
開源程度 完全開源 部分開源(CLI 開源,模型閉源)
模型綁定 OpenAI 系(GPT-4.1 / o3) Anthropic 系(Opus / Sonnet)
執行模式 沙箱優先 直接執行 + 權限審批
多 Agent 單 Agent Sub-agent 並行委派
MCP 生態 支援,較新 最完整,雙向通道
Skills codex.md 配置 目錄級 skill 系統
社群活躍度 極高(120k★)
適合場景 想用 GPT 系模型 + 沙箱安全優先 複雜工程任務 + 生態整合

Codex 勝在開源透明 + 沙箱安全
Claude Code 勝在生態完整 + 多 Agent 編排
選模型偏好先,再選工具。

六、總結 ➡️ 玩轉 Agent

可以根據以下思路去選擇要怎麼使用 Agent:

  • 我只想驗證一個想法 → OpenClaw / ZeroClaw
  • 我要把 AI 流程嵌進現有業務系統 → LangGraph
  • 我每天寫程式,想讓 AI 幫我幹活 → Claude Code / Codex

實際上肯定是混著用的:

OpenClaw 探索一些新的諮詢 ➡️ LangGraph 支撐生產業務 ➡️ 使用 Codex 或 CC,讓 AI 幫我們上班

回過頭看 AI 大模型一開始的模樣:基礎的一問一答
3 年時間過去,AI 能在各行各業深入落地,Workflow + Agent 功不可沒。
所以,別再簡單地用豆包、ds 查問題了。

把工具用起來,來編排任務驅動 AI 幹活,解放我們自己的生產力!


原文出處:https://juejin.cn/post/7638825467915993140


精選技術文章翻譯,幫助開發者持續吸收新知。

共有 0 則留言


精選技術文章翻譯,幫助開發者持續吸收新知。
🏆 本月排行榜
🥇
站長阿川
📝16   💬11   ❤️2
541
🥈
alicec
📝1   ❤️2
76
🥉
我愛JS
💬1  
4
評分標準:發文×10 + 留言×3 + 獲讚×5 + 點讚×1 + 瀏覽數÷10
本數據每小時更新一次
📢 贊助商廣告 · 我要刊登