Claude Opus 4.8 來了,三個關注點!

時至今日,還沒有一個敢說,全面超越 Opus4.7。

國產模型基本上還在對標 4.6。

就在此時 Claude Opus4.8 又來了!

我快速整理了這次發布的三個亮點,一起來看一下!

1、基準數據

下面是 6 小時前,Claude 官方 X 發的一張基準數據圖:

先說明一下,所有公司的基準測試都有可能有水分,但 Anthropic 的水分最低,它有實力,沒必要摻水。

從這張圖可以看到,幾個關鍵基準都處於領先地位,只有 Terminal-Bench 2.1 不敵 GPT-5.5。GPT-5.5 在這方面確實很強,所以我很喜歡讓它幫我操作電腦,做安裝、設定這類工作非常穩!

當然,在編程代理方面,Opus 是遙遙領先!

Agentic coding(代理式編程)這一項領先第二名 5 個點。

第二名是它自己的前一代 Opus 4.7。

比 GPT-5.5 領先 10 個點,比 Gemini 3.1 Pro 領先 15 個點!

多學科推理、操作電腦、知識工作、金融分析也都小幅領先對手!

值得關注的是它特別加入了「金融分析」這個指標!

啥叫金融,就是跟「錢」有關!大家可以試試讓它……Opus 可能要往這個方向發力了。

Opus 4.8 已經全面發布,價格和 4.7 完全一樣!

2、快速模式

官方消息的第二個重點是:Opus4.8 已經支援快速模式!

快速模式是什麼意思呢?就是同一個模型,速度大約提升 2.5 倍。這個模式的重點是在保證品質的同時提升速度。 也就是提升效率!

還有一個好消息是:Fast 模式降價 66%!

也就是說從 Opus 4.7 到 Opus 4.8,能力免費提升,快速模式還能大幅降價!

3、Claude Code

第三條消息和 Claude Code 有關,這是最強的編程代理 CLI 工具!

官方特地錄了一支 1 分 21 秒的影片。

強調說:

在 CC 中,opus 4.8 就像經驗豐富的工程師一樣進行調用,而人類持續檢查。

它在長時間運行的會話中保持專注,並在你的程式碼庫中追蹤工作進展,因此你可以把一項功能或 bug 排查任務交給它,同時專注於下一步。

這意思就相當於從特斯拉的 AP 升級到 FSD。也就是說更專業,能更獨立自主地完成 Bug 修復或新功能開發。

其實這一點 Opus 4.7 就已經有苗頭了。基本上需求清楚,一輪出 MVP 版本!

另外還有一條消息專門提到了 Claude Code 的一個全新功能:動態工作流程(研究預覽版)。

介紹是這樣的:

對於最棘手的任務,Claude 會制定計畫,執行數百個平行子代理,並在回報結果前驗證其工作。想像一下涉及數百個檔案的遷移任務。

Claude Code 在這方面真的是遙遙領先,數百個智能體……!

另外我還看到有人發布了這樣一支影片:

Effort 思考強度,除了之前的五個等級之外,在 Max 上面還新增了一個 ultracode 模式!

下面的備註就是 xhigh + workflows!

在編程這條路上,Claude 是無敵的存在!

一個在編程上遙遙領先的模型,其他能力不會弱,事實也是如此。據說在文字表述方面,也修復了 4.7 一些過度 GPT 化的表達。

Nice!今天可以測一波,只是……額度快沒囉~~! 好東西,唯一的缺點就是貴啊。

參考連結:

www.anthropic.com/news/claude…

claude.com/blog/introd…


原文出處:https://juejin.cn/post/7644861167895822386


精選技術文章翻譯,幫助開發者持續吸收新知。

共有 0 則留言


精選技術文章翻譯,幫助開發者持續吸收新知。
🏆 本月排行榜
🥇
站長阿川
📝12   💬4   ❤️1
456
🥈
alicec
📝1   ❤️2
86
#4
我愛JS
💬1  
3
評分標準:發文×10 + 留言×3 + 獲讚×5 + 點讚×1 + 瀏覽數÷10
本數據每小時更新一次
📢 贊助商廣告 · 我要刊登