「無法自動化 AI 的公司所忽略的『評估』問題,以及對此作出回應的 ERC-8004,將從商業視角進行解說。」
這幾年來,AI 一直伴隨著「某種程度上什麼都做得到」的期待被談論,這就是所謂的 AI 泡沫。然而在實際導入現場後,許多企業都在自動化上卡關了。
原因很單純:AI 的輸出存在不確定性。即使輸入相同,結果也可能不一樣;看起來很像那麼回事,實際上卻是錯的。要把這樣的 AI 不經人工介入地整合進業務流程,難度遠比想像中高。
因此,現在關注焦點正逐漸轉向另一個議題:不是「AI 能做什麼」,而是「如何評估 AI 的輸出」。如果沒有一套機制來判斷產出的答案是否值得信賴,自動化就無法往前推進。
而這個議題,也連結到了更進一步的未來。
在 Salesforce 的 Agentforce、Microsoft 的 Copilot Studio 等多代理人系統已逐漸滲透實際現場的今天,筆者認為未來的 AI 將不再只是人類逐一下指令的工具,而會成為能夠自行判斷、必要時向外部 AI 交辦工作、接收成果後再往下推進的存在——也就是一種編排(orchestration)/多代理人(multi-agent)式的規格,會變得理所當然。
這裡最重要的是「外部」這一點。未來不會只是企業內部自己架設的 AI 就能解決一切,而是會與其他公司公開的 AI 與工具協作。例如,企業內部的業務 AI 把付款交給 A 公司的 AI、把信用審查交給 B 公司的 AI,透過這樣的方式分工與串聯。
在這樣的世界裡,會出現一個新的問題:
在大量 AI 相關服務公開於世的情況下,要如何向對方說明自家 AI 服務與其他公司的 AI 服務有何不同,並讓對方選擇自己?
當 AI 之間能自主協作的時代到來時,能夠「表達自家 AI 服務的優勢並讓人信任」這件事,將比以往更直接地關係到競爭力。
AI 之間要協作,前提是能找到對方。更進一步,找到之後還必須能安全確認對方是否值得信賴。
換句話說,我們需要這樣一個「媒介(平台)」:
然而就現況而言,負責 AI 互動的代表性機制(如 Google 的 A2A、Anthropic 推出的 MCP 等),雖然能處理「如何對話」、「能自稱可以做什麼」,卻無法涵蓋「哪裡有 AI、如何信任它」這部分的發現與信任問題。這個缺口一直懸在那裡。
作為這個「發現」與「信任」的基礎,如今再次受到關注的,是 Web3(區塊鏈)。
從商業角度來看,重點在於:
你也可以把它理解成「一份以相同格式整理、任何人都能查閱、而且若被修改就會留下痕跡的名冊」。這正是未來走向自主化的 AI 代理人時代所需要的基礎設施。
為了回應這些需求,2025 年公開、並在全球引發討論的,就是 ERC-8004(通稱:Trustless Agents)。作者陣容包括 MetaMask、Ethereum Foundation、Google、Coinbase 等,也足以看出其受關注程度之高。
(截至本稿撰寫時,它仍處於 EIP 草案階段,但在 2026/1/29 已於 Ethereum 主網開始運作,且在最初一個月內已有超過 45,000 個 AI 代理人依據此規格完成註冊!)
ERC-8004 所提出的目標非常明確:
即使事前沒有信任關係,也能跨越組織邊界,讓 AI 代理人得以「發現、選擇、並互動」。
為了實現這個目標,ERC-8004 以三個帳本(登錄簿/registry)的形式整理需求。整體概念如下。

圖的看法很簡單。以中央的區塊鏈為基礎,三個帳本都與 AI 代理人相連。
其他代理人則透過參照這條區塊鏈來發現目標 AI。接下來我們依序來看這三個帳本。
首先,會為每個 AI 代理人賦予一個可攜帶、且不易被刪除的專屬 ID。
在這裡會掛載該 AI 的概要、技能、對應領域(domain)、聯絡方式或連接方法等資訊。也就是讓 AI 能用共通格式自我介紹:「我是誰、擅長什麼、要怎麼連」,可說是AI 的身分證。
其商業意義在於,能以全球共通的形式表達自家 AI 服務的優勢。前面提到「自家 AI 服務和別人有何不同」這個問題,這裡就提供了答案的基礎。

從圖像來說,這項優勢可歸納成兩點。透過 NFT(AI 的 DID)這種共通規格將 AI 綁定到帳本上,(1) 它會成為其他代理人在發現時的起點,(2) 帳本上相關資料的掛載位置會變得清楚。像是「瀏覽」、「轉移」這類處理,也能借助 NFT 的機制快速完成。
AI 的輸出很難量化,只靠規格表也無法判斷好壞。因此,實際使用過的使用者或其他 AI 所留下的評價(回饋) 就變得很關鍵。
ERC-8004 提供了一套能將這些評價記錄並作為證跡查閱的機制。評分與標籤都會留下來,任何人都能參考;同時也設計了篩選評價者可信度的機制(例如依評論者進行過濾)。
其商業意義在於,可把「來自實績的信任」轉化為可攜帶的資產。一個持續做出好成果的 AI,其評價會作為證跡累積下來,進而促成下一筆交易。簡單來說,就是把口碑保留下來,而且不容易被竄改。

若結合圖解來說,前面提到的 AI 需求,在這個 Registry 中扮演的角色可以簡潔地理解為:基於用使用者自身的 FB 補足 AI 輸出不確定性高、難以保證品質的想法,將記錄保留下來。像是「這裡很好用,但那裡就……」這類真實評價會被登錄到帳本中,逐步累積成評價證跡。
評價畢竟帶有使用者或 AI 的主觀性,因此除了評價之外,還需要一種系統層面已確保安全性與正確性的客觀背書。
ERC-8004 提供了讓第三方驗證者能夠獨立檢查 AI 的工作,並把結果作為證跡保存的機制。驗證方式不會被固定為單一形式,而是可以從多種方法中選擇,例如透過重新執行來確認,或使用密碼技術、專用的安全執行環境來驗證。
更重要的是,可以依照風險選擇不同層級的信任。像是訂披薩這種輕量任務,和醫療診斷這種高風險任務,對信任的嚴格程度本來就不同。ERC-8004 讓人可以依照情境,切換不同的信任模型。

總結來說,在這個 Registry 中,為了讓 AI 能夠自主協作,也就是不經由人的決策就能確認合作對象 AI 的安全性,會由各領域的專家型驗證者去檢查 AI 的工作,並將驗證結果登錄到帳本中,從而作為「已驗證」的客觀證跡保存下來。
技術規格的細節可以交給工程師,但作為與決策相關的人,應該帶走的重點如下。
| 觀點 | 過去 | 未來(ERC-8004 式世界) |
|---|---|---|
| AI 的評估軸 | 「能做什麼」 | 「如何信任其輸出」 |
| 自家 AI 服務的呈現方式 | 個別的業務/提案資料 | 以共通規格呈現的身分證+評價+已驗證證跡 |
| 合作對象的找法 | 既有交易/人脈基礎 | 從公開帳本發現,並當場確認安全性 |
| 信任的依據 | 合約、品牌 | 較難竄改的證跡(評價、驗證) |
若用一句話總結重點,就是:
當 AI 進入自主連接外部的時代,是否擁有這些「證跡」,將決定誰是被選中的 AI,誰不是。
ERC-8004 目前仍處於草案階段,並不代表它已經確定會成為業界標準。然而,「如何把發現與信任機制化」 這個問題,隨著 AI 代理人的普及,只會越來越無法迴避。
如果你是 AI 服務提供者,就該思考「如何將自家 AI 服務的優勢與可信度作為證跡留下來」。如果你是 AI 服務使用者,則要思考「應該用什麼標準來選擇外部 AI 服務,並進行安全確認」。不論站在哪個立場,這都是現在就值得開始思考的主題。
在 AI 泡沫的熱度逐漸退去、開始被追問「到底哪個才可信」的此刻,以制度與機制來保障信任 的思維就顯得格外有力量。ERC-8004 正是這樣一種具體形式,站在 AI(代理人)與 Web3 的交會點上。
在持續追蹤技術發展的同時,也請務必將「如何為自家 AI 戰略設計信任證跡」這個視角納入考量。
我所屬的 Sapeet,以「科學化理解人,打造貼近人的支持」為使命,聚集了背景多元且彼此尊重合作的工程師與顧問。面對這個變化持續加速的時代,我們正在招募能主動因應變化的夥伴!
就算只是「想先聊聊」也非常歡迎!期待與你相見!
參考:ERC-8004: Trustless Agents(Ethereum Improvement Proposals)