時至今日,還沒有一個敢說,全面超越 Opus4.7。
國產模型基本上還在對標 4.6。
就在此時 Claude Opus4.8 又來了!

我快速整理了這次發布的三個亮點,一起來看一下!
下面是 6 小時前,Claude 官方 X 發的一張基準數據圖:

先說明一下,所有公司的基準測試都有可能有水分,但 Anthropic 的水分最低,它有實力,沒必要摻水。
從這張圖可以看到,幾個關鍵基準都處於領先地位,只有 Terminal-Bench 2.1 不敵 GPT-5.5。GPT-5.5 在這方面確實很強,所以我很喜歡讓它幫我操作電腦,做安裝、設定這類工作非常穩!
當然,在編程代理方面,Opus 是遙遙領先!
Agentic coding(代理式編程)這一項領先第二名 5 個點。
第二名是它自己的前一代 Opus 4.7。
比 GPT-5.5 領先 10 個點,比 Gemini 3.1 Pro 領先 15 個點!
多學科推理、操作電腦、知識工作、金融分析也都小幅領先對手!
值得關注的是它特別加入了「金融分析」這個指標!
啥叫金融,就是跟「錢」有關!大家可以試試讓它……Opus 可能要往這個方向發力了。
Opus 4.8 已經全面發布,價格和 4.7 完全一樣!
官方消息的第二個重點是:Opus4.8 已經支援快速模式!

快速模式是什麼意思呢?就是同一個模型,速度大約提升 2.5 倍。這個模式的重點是在保證品質的同時提升速度。 也就是提升效率!
還有一個好消息是:Fast 模式降價 66%!
也就是說從 Opus 4.7 到 Opus 4.8,能力免費提升,快速模式還能大幅降價!
第三條消息和 Claude Code 有關,這是最強的編程代理 CLI 工具!

官方特地錄了一支 1 分 21 秒的影片。
強調說:
在 CC 中,opus 4.8 就像經驗豐富的工程師一樣進行調用,而人類持續檢查。
它在長時間運行的會話中保持專注,並在你的程式碼庫中追蹤工作進展,因此你可以把一項功能或 bug 排查任務交給它,同時專注於下一步。
這意思就相當於從特斯拉的 AP 升級到 FSD。也就是說更專業,能更獨立自主地完成 Bug 修復或新功能開發。
其實這一點 Opus 4.7 就已經有苗頭了。基本上需求清楚,一輪出 MVP 版本!
另外還有一條消息專門提到了 Claude Code 的一個全新功能:動態工作流程(研究預覽版)。
介紹是這樣的:
對於最棘手的任務,Claude 會制定計畫,執行數百個平行子代理,並在回報結果前驗證其工作。想像一下涉及數百個檔案的遷移任務。
Claude Code 在這方面真的是遙遙領先,數百個智能體……!
另外我還看到有人發布了這樣一支影片:

Effort 思考強度,除了之前的五個等級之外,在 Max 上面還新增了一個 ultracode 模式!
下面的備註就是 xhigh + workflows!
在編程這條路上,Claude 是無敵的存在!
一個在編程上遙遙領先的模型,其他能力不會弱,事實也是如此。據說在文字表述方面,也修復了 4.7 一些過度 GPT 化的表達。
Nice!今天可以測一波,只是……額度快沒囉~~! 好東西,唯一的缺點就是貴啊。
參考連結: