小編精選 - 技術文章翻譯 · 05月31日

Claude Opus 4.8 來了，三個關注點！

時至今日，還沒有一個敢說，全面超越 Opus4.7。

國產模型基本上還在對標 4.6。

就在此時 Claude Opus4.8 又來了！

我快速整理了這次發布的三個亮點，一起來看一下！

1、基準數據

下面是 6 小時前，Claude 官方 X 發的一張基準數據圖：

先說明一下，所有公司的基準測試都有可能有水分，但 Anthropic 的水分最低，它有實力，沒必要摻水。

從這張圖可以看到，幾個關鍵基準都處於領先地位，只有 Terminal-Bench 2.1 不敵 GPT-5.5。GPT-5.5 在這方面確實很強，所以我很喜歡讓它幫我操作電腦，做安裝、設定這類工作非常穩！

當然，在編程代理方面，Opus 是遙遙領先！

Agentic coding（代理式編程）這一項領先第二名 5 個點。

第二名是它自己的前一代 Opus 4.7。

比 GPT-5.5 領先 10 個點，比 Gemini 3.1 Pro 領先 15 個點！

多學科推理、操作電腦、知識工作、金融分析也都小幅領先對手！

值得關注的是它特別加入了「金融分析」這個指標！

啥叫金融，就是跟「錢」有關！大家可以試試讓它……Opus 可能要往這個方向發力了。

Opus 4.8 已經全面發布，價格和 4.7 完全一樣！

2、快速模式

官方消息的第二個重點是：Opus4.8 已經支援快速模式！

快速模式是什麼意思呢？就是同一個模型，速度大約提升 2.5 倍。這個模式的重點是在保證品質的同時提升速度。 也就是提升效率！

還有一個好消息是：Fast 模式降價 66%！

也就是說從 Opus 4.7 到 Opus 4.8，能力免費提升，快速模式還能大幅降價！

3、Claude Code

第三條消息和 Claude Code 有關，這是最強的編程代理 CLI 工具！

官方特地錄了一支 1 分 21 秒的影片。

強調說：

在 CC 中，opus 4.8 就像經驗豐富的工程師一樣進行調用，而人類持續檢查。

它在長時間運行的會話中保持專注，並在你的程式碼庫中追蹤工作進展，因此你可以把一項功能或 bug 排查任務交給它，同時專注於下一步。

這意思就相當於從特斯拉的 AP 升級到 FSD。也就是說更專業，能更獨立自主地完成 Bug 修復或新功能開發。

其實這一點 Opus 4.7 就已經有苗頭了。基本上需求清楚，一輪出 MVP 版本！

另外還有一條消息專門提到了 Claude Code 的一個全新功能：動態工作流程（研究預覽版）。

介紹是這樣的：

對於最棘手的任務，Claude 會制定計畫，執行數百個平行子代理，並在回報結果前驗證其工作。想像一下涉及數百個檔案的遷移任務。

Claude Code 在這方面真的是遙遙領先，數百個智能體……！

另外我還看到有人發布了這樣一支影片：

Effort 思考強度，除了之前的五個等級之外，在 Max 上面還新增了一個 ultracode 模式！

下面的備註就是 xhigh + workflows！

在編程這條路上，Claude 是無敵的存在！

一個在編程上遙遙領先的模型，其他能力不會弱，事實也是如此。據說在文字表述方面，也修復了 4.7 一些過度 GPT 化的表達。

Nice！今天可以測一波，只是……額度快沒囉～～！好東西，唯一的缺點就是貴啊。

參考連結：

www.anthropic.com/news/claude…

claude.com/blog/introd…

原文出處：https://juejin.cn/post/7644861167895822386

小編精選 - 技術文章翻譯

精選技術文章翻譯，幫助開發者持續吸收新知。

0個讚 0留言 169瀏覽

共有 0 則留言

登入之後發表留言

文字內容提供幾種功能：
1) --- 會變成分隔線（上一行必須是空白）
2) # 會變成一級標題
3) ## 會變成二級標題
4) ### 會變成三級標題
5) **粗體文字**會顯示粗體文字
6) ```當第一行與最後一行會顯示程式碼
7) 請搜尋 Markdown 語法，了解各種格式

小編精選 - 技術文章翻譯

精選技術文章翻譯，幫助開發者持續吸收新知。

🏆 本月排行榜

🥇

站長阿川

📝17 💬3 ❤️5

741

🥈

我愛JS

📝3 💬6 ❤️4

170

🥉

流引色群@jptd847utpp

評分標準：發文×10 + 留言×3 + 獲讚×5 + 點讚×1 + 瀏覽數÷10

本數據每小時更新一次