小編精選 - 技術文章翻譯 · 05月14日

AI Agent 比較與選型

AI Agent 對比和選型

一、前言

！！！Agent，把天才 AI 變成一個能幹活的人！！！

如果說 LLM 大模型是一個天才引擎，那麼 Agent 就是很多無形的手，去控制這個天才引擎完成各種各樣的工作和流程，替人類真正地幹好活。

Agent 圈的主流產品/框架，如同百家爭鳴般，賽道分化明顯、定位涇渭分明：

有開箱即用的，可本地部署、多渠道接入的個人助理產品，最典型的就是 OpenClaw🦞
有適合生產落地的底層 Agent 編排框架，面向開發者/企業，自研複雜多智能體，比如：LangGraph
有高度產品化，內置於大廠應用；深度綁定自家模型，擁有工具調用、程式碼工程、終端任務能力的Agent 協作平台。比如大家都在用的：Claude Code、Gemini、Codex

下面我們就深入學習這些 Agent 的核心能力和應用場景！

二、概覽

流派	產物形態	應用場景	代表
開箱即用型	可部署的完整應用	個人 / 團隊 Agent 助理	OpenClaw、ZeroClaw、Dify
編排框架	SDK / 函式庫	自研複雜多智能體	LangGraph、CrewAI
產品工具型	CLI / IDE	開發者編碼、終端自動化	Claude Code、Codex、Gemini Cli

功能定位	集成成本	控制粒度	使用難度	擴展性	安全性
開箱即用型	端到端任務執行	中	中低	中高	高
編排框架	自建 Agent 編排	高	高	高	高
產品工具型	工程現場協作	低	低	極低	低

本文我們核心了解：OpenClaw、ZeroClaw、LangGraph、Codex、Claude Code

三、成品化 Agent 應用

這類 Agent 的特點是：你不需要寫程式，部署好就能用。它們是完整的應用，開箱即用。

1. OpenClaw 🦞（368k★）

核心亮點

本地優先的 AI 閘道：所有資料留在本地，隱私可控
25+ IM 平台接入，意味著你可以在社群軟體上直接下達指令：微信、QQ、飛書、iMessage、WhatsApp、Telegram、…… 幾乎是全渠道觸達
語音能力：macOS/iOS 支援喚醒詞，Android 支援連續語音對話（ElevenLabs + 系統 TTS）
Live Canvas：Agent 驅動的視覺化工作台（A2UI），不只是聊天框
多 Agent 路由：不同渠道可以路由到不同 Agent workspace，彼此隔離

部署步驟

bash 体验AI代码助手 代码解读复制代码# 安裝（Node.js 22.14+ / 建議 24）
npm install -g openclaw@latest

# 引導式初始化（選模型 provider、接入渠道、配安全）
openclaw onboard --install-daemon

# 檢查配置健康度
openclaw doctor

支援 npm / pnpm / bun，也支援 Nix 和 Docker 部署。
不挑模型 Provider —— 用你偏好的旗艦模型（Claude / GPT / Gemini / DeepSeek 等）。

安全機制

DM 配對：陌生人發訊息需要輸入配對碼才能與 Agent 互動
會話隔離：非主會話強制在沙箱中執行
openclaw doctor：一鍵稽核配置安全性

常見玩法

全渠道個人助理：行程、郵件、待辦、知識庫問答，只要在 IM 平台上 @它就行
團隊自動化 Bot：監聽 GitHub / GitLab 事件 → 自動處理 → 群組裡回報

總結：OpenClaw 是「Agent 界的 Homebrew」—— 生態決定了它能幹多少事，本地優先保證了你的資料不出門。

2. ZeroClaw 🦀（31k★）

核心亮點

單 Rust 二進制：極致輕量，最小核心僅 6.6MB，冷啟動極快
安全第一：預設 supervised 模式，OS 級沙箱（Linux Landlock / Bubblewrap / macOS Seatbelt / Docker），每次工具呼叫都有密碼學簽章收據，可稽核
20+ 模型 Provider：Anthropic、OpenAI、Ollama、任何 OpenAI 相容端點，支援 fallback 鏈和智慧路由
硬體 IoT 整合：GPIO / I2C / SPI / USB，支援樹莓派、STM32、Arduino、ESP32
SOP 引擎：事件驅動的標準作業流程（MQTT / Webhook / Cron / 外設觸發），支援審批門和可恢復執行

部署步驟

bash 体验AI代码助手 代码解读复制代码# 一鍵安裝
curl -fsSL https://raw.githubusercontent.com/zeroclaw-labs/zeroclaw/master/install.sh | bash

# 或從原始碼編譯（支援自訂 features）
git clone https://github.com/zeroclaw-labs/zeroclaw.git
cd zeroclaw && ./install.sh --source --features "telegram,ollama,gpio"

# 最小安裝（僅核心，6.6MB）
./install.sh --minimal

配置檔：~/.zeroclaw/config.toml，單一檔案就可以管理全部配置，非常方便。

技術架構

應用場景

邊緣 AI / IoT：在樹莓派上 7×24 跑 Agent，透過 GPIO 控制硬體
高安全環境：密碼學收據 + OS 沙箱，適合金融 / 醫療合規場景
終端裝置：Windows、Android（ZeroClaw-Android）整機裝置的 Agent 總控

ZeroClaw 是「Agent 界的嵌入式 Linux」—— 極致輕量 + 硬體級安全 + IoT 原生，在資源受限環境裡它是唯一選擇。

3. OpenClaw vs ZeroClaw

維度	OpenClaw 🦞	ZeroClaw 🦀
語言/執行環境	Node.js	Rust 單二進制
最小體積	~100MB+	6.6MB
生態規模	368k★，ClawHub 技能豐富	31k★，相容部分 OpenClaw Skills
安全模型	DM 配對 + 沙箱	密碼學收據 + OS 級沙箱
硬體支援	無	GPIO/I2C/SPI/USB
適合場景	個人/團隊全渠道助理	終端裝置 / IoT / 高安全環境
Windows	WSL2	WSL2

選型建議：資源充足、追求生態 → OpenClaw；資源受限、安全優先、要碰硬體 → ZeroClaw。

4. 插入講解下，最近很火的 Hermes 框架

Hermes Agent（132k★）

Nous Research 出品—— "The Agent That Grows With You" 。
核心理念：Agent 不該是靜態的，它的 Skills、Prompts、程式碼應該隨使用持續自我最佳化、成長學習。

技術框架

核心抽象：

Skills（程式記憶） ：Agent 完成複雜任務後自動提取可重複使用 Skill，下次直接呼叫
Persistent Memory：使用者輪廓 + 會話歷史 + 長期知識，跨會話保留
Subagent 並行：spawn 隔離子 Agent 並行處理子任務
Cron 排程器：內建定時任務，Agent 可自主設定週期性工作
六種執行後端：Local / Docker / SSH / Daytona / Singularity / Modal

技術特點和優勢

✅ 自我進化的 Skills：任務完成後自動建立 Skill，使用中自動改進
✅ Self-evolution：DSPy + GEPA（遺傳帕累托提示進化，ICLR 2026 Oral），純 API 呼叫無需 GPU，單次 $2-10
✅ 模型無關：OpenRouter 200+ 模型、OpenAI、Anthropic、NVIDIA NIM、Ollama
✅ 多平台閘道：Telegram / Discord / Slack / WhatsApp / Signal / Email，單進程多渠道
✅ 40+ 內建工具 + 原生 MCP 擴充
✅ FTS5 會話搜尋：全文檢索 + LLM 摘要
⚠️ Self-evolution 仍在早期：Phase 1 已實現，Phase 2-5 規劃中

安裝和上手

bash 体验AI代码助手 代码解读复制代码# 一鍵安裝
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
source ~/.bashrc

# 互動式配置
hermes model    # 選擇 LLM provider
hermes tools    # 配置可用工具
hermes setup    # 完整設定嚮導

# 啟動
hermes          # CLI 聊天
hermes gateway  # 多渠道閘道

Self-evolution 工作原理

markdown 体验AI代码助手 代码解读复制代码日常使用 → 完成任務 → 自動建立/改進 Skill
    ↓
觸發 Self-evolution（手動或定時）
    ↓
DSPy 收集回饋 → GEPA 遺傳演算法搜尋最優方案
    ↓
帕累托篩選（準確性 × 效率 × 成本）
    ↓
最優變體替換原 Skill → Agent 變得更聰明

適合的場景

持續最佳化的 AI 助手：越用越順手，不需要手動調 prompt
多渠道營運：一個程序同時服務多個平台
Serverless 彈性：Modal/Daytona 按需休眠
研究探索：Self-evolution 本身就是很好的研究工具

Hermes 是「會長大的 Agent」—— 你用它，它也在學你。Self-evolution 是它最大的護城河。

四、Agent 編排底層框架

這類框架解決的核心問題是：我要在自己的產品裡做一個 Agent，但不想從零實作調度、狀態管理、工具註冊這些雜事。
換言之：你的業務邏輯才是核心，框架幫你搞定「讓 AI 按流程幹活」這件事。

1. LangGraph（31.2k★）

LangChain 團隊出品，靈感來自 Google Pregel、Apache Beam 和 NetworkX——用 有向圖 來編排 Agent 的工作流程。控制粒度最細的 Agent 框架，沒有之一。

技術框架

三個核心抽象：

Node（節點） ：每個節點是一個處理步驟—— LLM 呼叫、工具執行、或任何 Python/TS 函式
Edge（邊） ：節點之間的轉換邏輯，支援條件路由
State（狀態） ：跨節點共享的上下文，自動持久化，程序掛了也能從斷點恢復

語言支援：Python（langgraph）+ TypeScript（langgraphjs）雙版本。

技術特點和優勢

✅ 顯式可控：每個決策分支都是程式碼裡的一條邊，不存在「LLM 自己決定下一步」的黑盒
✅ 持久化執行：State 自動持久化到 Postgres / Redis / SQLite，程序崩潰可從 Checkpoint 恢復
✅ Human-in-the-loop：任意節點可插入人工審批，Agent 暫停等人確認後繼續
✅ Time-travel 除錯：回溯到任意歷史 State 快照，重放執行路徑
✅ 可觀測性：深度整合 LangSmith，每一步 token 消耗、延遲、決策路徑全可追蹤
✅ 長期記憶：支援短期工作記憶 + 跨會話長期持久記憶
⚠️ 學習曲線陡：StateGraph / MessageGraph / Pregel 多種抽象，新手容易迷失
⚠️ 生態綁定：雖然可獨立使用，但強引導走 LangChain + LangSmith 全家桶

典型程式碼示例

python 体验AI代码助手 代码解读复制代码from langgraph.graph import StateGraph, END
from typing import TypedDict

# 1. 定義狀態
class AgentState(TypedDict):
    messages: list
    next_action: str

# 2. 定義節點函式
def analyze(state: AgentState) -> AgentState:
    ...

def execute(state: AgentState) -> AgentState:
    ...

# 3. 組裝圖
graph = StateGraph(AgentState)
graph.add_node("analyze", analyze)
graph.add_node("execute", execute)
graph.add_node("review", human_review)

# 4. 條件路由
graph.set_entry_point("analyze")
graph.add_edge("analyze", "execute")
graph.add_conditional_edges(
    "execute",
    lambda s: s["next_action"] == "need_review",
    {True: "review", False: END}
)

# 5. 編譯（帶持久化）
app = graph.compile(checkpointer=PostgresSaver(...))

接入流程

需求分析 
　↓
定義 State Schema 
　↓
編寫 Node 函式 
　↓
定義 Edge 路由邏輯 
　↓
組裝 StateGraph 
　↓
配置 Checkpointer（Postgres/Redis）
　↓
部署（LangGraph Cloud / 自架）
　↓
接入 LangSmith 監控

適合的場景

企業級審批流程：貸款審批、內容審核、風控決策——每一步可追溯
客服系統：意圖識別 → 檢索 → 工具呼叫 → 人工升級，精確控制
資料處理 Pipeline：ETL + AI 分析 + 人工確認的混合流程
多步推理：需要 Human-in-the-loop 的複雜分析場景

LangGraph 是「Agent 界的狀態機」—— 你畫什麼圖，Agent 就走什麼路。確定性最強，學習成本也最高。

五、內建 Agent 能力的大廠應用

這是研發同學最熟悉的，我們日常就在用 Codex、Claude Code、Gemini 等進行 AI 編碼。
這些工具都深度綁定自家模型，內建了很垂直的任務規劃、工具呼叫、終端維運等 Agent 場景，無需依賴第三方框架即可直接使用智能體能力。
本質上，這些工具自帶 Agent —— 且透過 MCP 協議，你的專案還能反向呼叫它們的能力。

1. Codex（80k★）

定位：OpenAI 開源的終端 Agent，"Lightweight coding agent that runs in your terminal"。
安裝方式：

bash 体验AI代码助手 代码解读复制代码npm install -g @openai/codex
# 直接下載桌面應用也可以

使用最佳實踐：

全自動模式：codex "重構這個函式並加上單元測試" → Agent 自動規劃、修改、驗證
審批模式（推薦） ：每一步操作需確認後才執行，適合生產程式碼
沙箱隔離：所有檔案操作在沙箱內執行，不會直接污染工作目錄

模型支援：

預設 GPT-4.5（推薦）
支援 o3、o4-mini 等推理模型
透過環境變數可切換模型：OPENAI_MODEL=o3 codex "..."

多會話管理：

支援 --resume 恢復上次會話
專案級上下文：自動讀取 AGENTS.md / codex.md 作為專案指令

MCP / Skills 管理：

原生支援 MCP（Model Context Protocol），可接入外部工具
透過 codex.md 配置專案級 instructions 和工具權限
支援自訂 approval 規則：哪些操作自動執行、哪些需審批

2. Claude Code（120k★）

定位：Anthropic 官方 CLI Agent，目前生態最完整、社群最活躍的編碼 Agent。

安裝方式：

bash 体验AI代码助手 代码解读复制代码npm install -g @anthropic-ai/claude-code

使用最佳實踐：

Plan → Execute 分離：複雜任務先讓它出計畫（/plan），確認後再執行
Sub-agent 並行：大任務自動拆分成多個子 Agent 並行處理
Skills 系統：把常用操作封裝成 Skill，一鍵重用（如「寫飛書文件」、「產生 PR」）

模型支援：

預設 Claude Opus 4（最強推理）
支援 Sonnet 4 / Haiku 4（快速模式 /fast）
透過 /model 指令或 CLAUDE_MODEL 環境變數切換

多會話管理：

自動上下文壓縮：對話可無限長，系統自動管理
/resume 恢復歷史會話
支援多 workspace 並行：每個專案獨立上下文
背景 Agent：run_in_background 讓 Agent 在背景跑長任務

MCP / Skills 管理：

MCP 雙向通道：
- 作為 MCP Client：接入飛書、GitHub、資料庫等外部工具
- 作為 MCP Server：讓其他應用呼叫 Claude Code 的能力（讀程式碼、改檔案、跑命令）
Skills 生態：.claude/skills/ 目錄管理專案級技能
權限體系：.claude/settings.json 精細控制工具權限
Hooks：在工具呼叫前後自動執行自訂腳本

3. Codex vs Claude Code

維度	Codex	Claude Code
開源程度	完全開源	部分開源（CLI 開源，模型閉源）
模型綁定	OpenAI 系（GPT-4.1 / o3）	Anthropic 系（Opus / Sonnet）
執行模式	沙箱優先	直接執行 + 權限審批
多 Agent	單 Agent	Sub-agent 並行委派
MCP 生態	支援，較新	最完整，雙向通道
Skills	codex.md 配置	目錄級 skill 系統
社群活躍度	高	極高（120k★）
適合場景	想用 GPT 系模型 + 沙箱安全優先	複雜工程任務 + 生態整合