「無法自動化 AI 的公司所忽略的『評估』問題,以及對此作出回應的 ERC-8004,將從商業視角進行解說。」

前言:為什麼現在「AI 的評估」成為焦點

這幾年來,AI 一直伴隨著「某種程度上什麼都做得到」的期待被談論,這就是所謂的 AI 泡沫。然而在實際導入現場後,許多企業都在自動化上卡關了

原因很單純:AI 的輸出存在不確定性。即使輸入相同,結果也可能不一樣;看起來很像那麼回事,實際上卻是錯的。要把這樣的 AI 不經人工介入地整合進業務流程,難度遠比想像中高。

因此,現在關注焦點正逐漸轉向另一個議題:不是「AI 能做什麼」,而是「如何評估 AI 的輸出」。如果沒有一套機制來判斷產出的答案是否值得信賴,自動化就無法往前推進。

而這個議題,也連結到了更進一步的未來。

自主運作,並與外部 AI 協作的時代

在 Salesforce 的 Agentforce、Microsoft 的 Copilot Studio 等多代理人系統已逐漸滲透實際現場的今天,筆者認為未來的 AI 將不再只是人類逐一下指令的工具,而會成為能夠自行判斷、必要時向外部 AI 交辦工作、接收成果後再往下推進的存在——也就是一種編排(orchestration)/多代理人(multi-agent)式的規格,會變得理所當然。

這裡最重要的是「外部」這一點。未來不會只是企業內部自己架設的 AI 就能解決一切,而是會與其他公司公開的 AI 與工具協作。例如,企業內部的業務 AI 把付款交給 A 公司的 AI、把信用審查交給 B 公司的 AI,透過這樣的方式分工與串聯。

在這樣的世界裡,會出現一個新的問題:

在大量 AI 相關服務公開於世的情況下,要如何向對方說明自家 AI 服務與其他公司的 AI 服務有何不同,並讓對方選擇自己?

當 AI 之間能自主協作的時代到來時,能夠「表達自家 AI 服務的優勢並讓人信任」這件事,將比以往更直接地關係到競爭力。

需要的是一個「能立即發現、且能安全確認」的共同場域

AI 之間要協作,前提是能找到對方。更進一步,找到之後還必須能安全確認對方是否值得信賴

換句話說,我們需要這樣一個「媒介(平台)」:

  • 能依工作需求,立即發現外部公開的 AI 代理人或 AI 工具
  • 能在當下確認找到的 AI 是否安全、是否可信

然而就現況而言,負責 AI 互動的代表性機制(如 Google 的 A2A、Anthropic 推出的 MCP 等),雖然能處理「如何對話」「能自稱可以做什麼」,卻無法涵蓋「哪裡有 AI、如何信任它」這部分的發現與信任問題。這個缺口一直懸在那裡。

此時重新受到關注的 Web3

作為這個「發現」與「信任」的基礎,如今再次受到關注的,是 Web3(區塊鏈)

從商業角度來看,重點在於:

  • 透過標準化規格將 AI 綁定到帳本上,就能一次以相同粒度取得全球 AI 的公開資訊
  • 不是由單一公司管理的封閉資料庫,而是以較難竄改、且不依賴特定企業的方式保存資訊

你也可以把它理解成「一份以相同格式整理、任何人都能查閱、而且若被修改就會留下痕跡的名冊」。這正是未來走向自主化的 AI 代理人時代所需要的基礎設施。

於是 ERC-8004(Trustless Agents)登場

為了回應這些需求,2025 年公開、並在全球引發討論的,就是 ERC-8004(通稱:Trustless Agents)。作者陣容包括 MetaMask、Ethereum Foundation、Google、Coinbase 等,也足以看出其受關注程度之高。
(截至本稿撰寫時,它仍處於 EIP 草案階段,但在 2026/1/29 已於 Ethereum 主網開始運作,且在最初一個月內已有超過 45,000 個 AI 代理人依據此規格完成註冊!)

ERC-8004 所提出的目標非常明確:

即使事前沒有信任關係,也能跨越組織邊界,讓 AI 代理人得以「發現、選擇、並互動」。

為了實現這個目標,ERC-8004 以三個帳本(登錄簿/registry)的形式整理需求。整體概念如下。

ERC-8004 的整體概念:Identity / Reputation / Validation 三個 Registry 與區塊鏈的關係

圖的看法很簡單。以中央的區塊鏈為基礎,三個帳本都與 AI 代理人相連

  • Identity Registry(左上→中央):為 AI 發行專屬 ID,作為一切的起點
  • Reputation Registry(左):累積來自使用者的評價(FB)
  • Validation Registry(右):記錄驗證者的檢查結果

其他代理人則透過參照這條區塊鏈來發現目標 AI。接下來我們依序來看這三個帳本。

① Identity Registry|建立 AI 的「身分證」

首先,會為每個 AI 代理人賦予一個可攜帶、且不易被刪除的專屬 ID

在這裡會掛載該 AI 的概要、技能、對應領域(domain)、聯絡方式或連接方法等資訊。也就是讓 AI 能用共通格式自我介紹:「我是誰、擅長什麼、要怎麼連」,可說是AI 的身分證

其商業意義在於,能以全球共通的形式表達自家 AI 服務的優勢。前面提到「自家 AI 服務和別人有何不同」這個問題,這裡就提供了答案的基礎。

Identity Registry:以 NFT(AI 的 DID)作為共通規格,將資料與 AI 代理人連結,成為其他代理人在發現時的起點

從圖像來說,這項優勢可歸納成兩點。透過 NFT(AI 的 DID)這種共通規格將 AI 綁定到帳本上,(1) 它會成為其他代理人在發現時的起點,(2) 帳本上相關資料的掛載位置會變得清楚。像是「瀏覽」、「轉移」這類處理,也能借助 NFT 的機制快速完成。

② Reputation Registry|把「評價」作為證跡保存下來

AI 的輸出很難量化,只靠規格表也無法判斷好壞。因此,實際使用過的使用者或其他 AI 所留下的評價(回饋) 就變得很關鍵。

ERC-8004 提供了一套能將這些評價記錄並作為證跡查閱的機制。評分與標籤都會留下來,任何人都能參考;同時也設計了篩選評價者可信度的機制(例如依評論者進行過濾)。

其商業意義在於,可把「來自實績的信任」轉化為可攜帶的資產。一個持續做出好成果的 AI,其評價會作為證跡累積下來,進而促成下一筆交易。簡單來說,就是把口碑保留下來,而且不容易被竄改。

Reputation Registry:以使用者自身的回饋補足 AI 輸出不確定性高、難以確保品質的問題,並將其作為評價證跡保存

若結合圖解來說,前面提到的 AI 需求,在這個 Registry 中扮演的角色可以簡潔地理解為:基於用使用者自身的 FB 補足 AI 輸出不確定性高、難以保證品質的想法,將記錄保留下來。像是「這裡很好用,但那裡就……」這類真實評價會被登錄到帳本中,逐步累積成評價證跡。

③ Validation Registry|保存「已驗證」的證跡

評價畢竟帶有使用者或 AI 的主觀性,因此除了評價之外,還需要一種系統層面已確保安全性與正確性的客觀背書。

ERC-8004 提供了讓第三方驗證者能夠獨立檢查 AI 的工作,並把結果作為證跡保存的機制。驗證方式不會被固定為單一形式,而是可以從多種方法中選擇,例如透過重新執行來確認,或使用密碼技術、專用的安全執行環境來驗證。

更重要的是,可以依照風險選擇不同層級的信任。像是訂披薩這種輕量任務,和醫療診斷這種高風險任務,對信任的嚴格程度本來就不同。ERC-8004 讓人可以依照情境,切換不同的信任模型。

Validation Registry:AI 要自主與其他 AI 協作,必須將系統安全性明示為外部公開資料,因此由專家(驗證者)將驗證結果註冊到帳本中

總結來說,在這個 Registry 中,為了讓 AI 能夠自主協作,也就是不經由人的決策就能確認合作對象 AI 的安全性,會由各領域的專家型驗證者去檢查 AI 的工作,並將驗證結果登錄到帳本中,從而作為「已驗證」的客觀證跡保存下來。

商業端應掌握的啟示

技術規格的細節可以交給工程師,但作為與決策相關的人,應該帶走的重點如下。

觀點 過去 未來(ERC-8004 式世界)
AI 的評估軸 「能做什麼」 「如何信任其輸出」
自家 AI 服務的呈現方式 個別的業務/提案資料 以共通規格呈現的身分證+評價+已驗證證跡
合作對象的找法 既有交易/人脈基礎 從公開帳本發現,並當場確認安全性
信任的依據 合約、品牌 較難竄改的證跡(評價、驗證)

若用一句話總結重點,就是:

當 AI 進入自主連接外部的時代,是否擁有這些「證跡」,將決定誰是被選中的 AI,誰不是。

ERC-8004 目前仍處於草案階段,並不代表它已經確定會成為業界標準。然而,「如何把發現與信任機制化」 這個問題,隨著 AI 代理人的普及,只會越來越無法迴避。

如果你是 AI 服務提供者,就該思考「如何將自家 AI 服務的優勢與可信度作為證跡留下來」。如果你是 AI 服務使用者,則要思考「應該用什麼標準來選擇外部 AI 服務,並進行安全確認」。不論站在哪個立場,這都是現在就值得開始思考的主題。

總結

在 AI 泡沫的熱度逐漸退去、開始被追問「到底哪個才可信」的此刻,以制度與機制來保障信任 的思維就顯得格外有力量。ERC-8004 正是這樣一種具體形式,站在 AI(代理人)與 Web3 的交會點上。

在持續追蹤技術發展的同時,也請務必將「如何為自家 AI 戰略設計信任證跡」這個視角納入考量。

最後

我所屬的 Sapeet,以「科學化理解人,打造貼近人的支持」為使命,聚集了背景多元且彼此尊重合作的工程師與顧問。面對這個變化持續加速的時代,我們正在招募能主動因應變化的夥伴!

就算只是「想先聊聊」也非常歡迎!期待與你相見!

Sapeet 招募資訊


參考:ERC-8004: Trustless Agents(Ethereum Improvement Proposals)


原文出處:https://qiita.com/can-can/items/5e13dace1a97cd6bd7a4


精選技術文章翻譯,幫助開發者持續吸收新知。

共有 0 則留言


精選技術文章翻譯,幫助開發者持續吸收新知。
🏆 本月排行榜
🥇
站長阿川
📝6   💬2  
339
🥈
我愛JS
💬1  
3
評分標準:發文×10 + 留言×3 + 獲讚×5 + 點讚×1 + 瀏覽數÷10
本數據每小時更新一次
📢 贊助商廣告 · 我要刊登