國產 CodingPlan「玩不起」,跑去玩 GPT5.5 了!

難受啊!

最近國產的 CodingPlan 全面收縮,不是轉成 TokenPlan 了,就是配額少得要命,動不動就是一個月 200 元。

要知道 OpenAI 的 GPT5.5 + Codex,也才 20 美金,能力比你們強一個級別,價格也才不到 140 RMB,配額還比你們多很多。

你們說怎麼選?

我來給你們分析一下現狀!

轟轟烈烈的國產模型「牛逼」之後,沒兩個月功夫,現在是個什麼情況了呢?

騰訊和阿里基本不搞 CodingPlan 了,全轉成 TokenPlan,按量計費,毫無性價比。

關鍵是毫無誠信,說換就換!

目前還能用的 CodingPlan 主要是火山方舟、智譜、MiniMax、Kimi。

火山方舟的問題是能力一般,配額一般。

智譜是能力不錯,配額也不錯,但是一般人估計買不到,另外也是一直在收縮配額。

MiniMax 價格和配額都還算良心,但是能力太一般了,當時宣稱自己是編程和 Agent SOTA,我現在終於悟了,得倒過來看。

Kimi 現在能力還行,但是配額少得可憐。

昨天晚上我統一測試了我手裡有的幾個 CodingPlan,結果真的一言難盡啊!

各有各的毛病,沒有一個順手的。

我就測試了兩個問題:

一個是讓它們幫我彙總一個現在最新的主流大模型 API 價目表。

一個是寫一篇 5 萬字、10 個章節的修仙小說。

下面就來看看各位選手的表現吧。

1、Kimi

其實最近我對 Kimi 的印象還算不錯。至少它的「能力和宣傳比」要比其他模型好很多。

但是它也有它的問題。目前最大的問題是配額很少,能力不穩定。

下面來看一下具體的例子情況。

先看價目表的情況。

價格對不對我先不說,看到這個模型型號我就已經不相信它了。

現在是 2026 年 4 月 24 號,OpenAI 已經發布 GPT5.5 了,Anthropic 已經更新到 Opus4.7 了。

它的結果還停留在 GPT-4.5、Opus4。

這還不是最離譜的,國內模型阿里雲是 Qwen3-235B-A22B,還有什麼 360 智腦、華為盤古大模型 Pangu-Σ、天工 3.0、GLM-4-Air。

國外的你查不到也就算了,國內的也不知道?

我是開了網路權限的啊!

然後看看修仙小說的情況:

這個目錄和大綱是能看的,好像有點那個味兒,字數也符合要求,大概寫了 5 萬多字。

問題在於它還沒有儲存檔案,配額就消耗完了。

這是我手動從對話視窗裡複製出來,存到檔案裡的。

5 萬字大概消耗了 63% 的配額!

之前的表格整理花了 37% 的配額!

這些我都沒有任何修改需求啊,是直接跑一輪就消耗完的。

如果我對第一個表格不滿意,我提出一次修改意見的話,可能整個配額就沒了,沒有第二項測試了。

活幹得不漂亮,配額消耗得很快!

2、火山

看完 Kimi 再來看一下火山。

下面是火山豆包的價目表:

這個表格幾乎和 Kimi 一個模子刻出來的。它認為目前 OpenAI 最新的模型是 GPT-4.5,主流模型是 GPT-4o。

Anthropic 的模型才更新到 Sonnet 3.7!

國產模型方面,也基本上是一個問題,太老了。

明明給了它們網路權限,它們為什麼就找不到最新的資料呢?還是完全沒有想過要去找?單純靠記憶?

火山比較好的一點是,做了頭部篩選,可以篩選廠商、地區和搜尋。

然後看一下小說部分:

其實小說光看標題都還可以,AI 最擅長的就是這種格式化的標題了,一字不差。

小說,主要還是看內容了。

我就不看了,我只是用它來測試 Token 消耗的。

火山的消耗比 Kimi 好很多,兩個任務完成大概只消耗了 15%。

火山豆包很長一段時間內首次連線延遲特別高,但是它完成一個整體專案的時間還是比較短的,也就是算是比較快的。

只是它的水準也就是勉強能用、適合大眾使用,作為 CodingPlan 顯然是不太夠用的。

3、MiniMax

然後我們再來看看最強智能體和編程模型 M2.7。

先看第一個例子:

所有人都交卷了,它還一直卡著,看了一下測試目錄,什麼都沒有生成!

我仔細查看了日誌檔:

發現開始沒多久它就因為 API 錯誤停工了!

最後停留在查詢 DeepSeek 價格這一個環節,然後就再也沒有請求了。

我看了一下我帳號後台的消耗情況,只呼叫了三次 API!!!

然後來看看寫小說的情況:

它寫的小說叫《天命道途》,是用 TXT 儲存不同的章節。

它有一個非常明顯的問題是,第一章的字數就不對。

我要求是每章 5000 字,它寫了 3990,誤差 20%。

兩個任務跑下來,配額沒消耗多少,它應該還是按次消耗,算是比較良心。

但是結果基本上處於不能用的狀態。它本身模型就小,整個智商確實「很感人」。

4、智譜 GLM

智譜在國內算是做得比較好的了,但是它也有它的問題。

先看價目表:

終於看到一個正常的了。

樓上各位看看人家的表現。

GLM5.1 正確取得到了最新的模型名稱。

GPT5.4 和 Claude Opus 4.7 確實是最新的模型了,昨天晚上 GPT5.5 還沒出來!

國內的資料也還可以,至少自家的模型基本都在了!

這一點上,GLM 就穩多了。

再來看看小說部分:

它的小說名字叫《逆天仙途》,怎麼看著有點眼熟呢?... 這個不重要!

重要的是,你們知道它為什麼只有 3 個章節嗎?

因為它寫了三章之後就卡住了,我也不知道它要寫到什麼時候。我實在受不了,就停了。

把模型換成 4.7 才順暢地把小說寫完,但是字數也不準。

說好的一章 5000 字,只寫了 1262 個字,加上標點符號也才 1415 個字。誤差 70%!

配額方面整體還好。

因為我是老套餐的 Pro 用戶,配額基本上沒有動過,就是 1%。

我看了下 Token 消耗了大概 100 萬多,所以 Pro 這個套餐量還是不少的。

問題是慢啊,5.1 完全不是正常速度,是很慢啊,4.7 又弱!

本來是興致勃勃地想測一下它們的套餐 Token 情況,但是出現了各種問題,所以搞得很無語。

刷基準測試的時候,個個都很厲害,真幹點活就各種問題。

要麼結果差得不行,要麼配額一下就沒了,要麼慢得要死,要麼所有毛病都有。

你們說,我圖啥呢!

要快、要強、要能幹有 Opus4.7;

要快、要強、要能幹、要配額有 GPT5.4。

這兩個也才 20 美金一個月啊,換算成人民幣不到 140。

現在國內的套餐 Pro 檔基本上就是 200 這個價位了。

現在 GPT5.5 也來了,能力只會比國產強,絕對不會比國產弱。

它還有自己的編程工具 Codex 終端版和桌面版。

它的桌面版已經做得很好了,現在包含了編程和日常兩種模式。

管理專案能力很強,操作電腦的能力也很強,有專門的 Computer Use 能力,直接操作本機軟體、操作瀏覽器。

關鍵人家配額也給力啊。

我拼命用也用不完,還動不動就重置。

你們看週配額才消耗了 10% 啊,5 小時配額基本都是滿血狀態,一般也就用到 10%~20%。

最後不禁要問一句,我拿真金白銀支持國產,國產拿什麼來回報我的?

用不停地修改套餐、縮減配額、低智的模型來回報我嗎?


剛剛看到群裡消息,DeepSeek V4 真的出了,我趕緊去看看,能否打破這種局面!


原文出處:https://juejin.cn/post/7631832575604129811


精選技術文章翻譯,幫助開發者持續吸收新知。

共有 0 則留言


精選技術文章翻譯,幫助開發者持續吸收新知。
🏆 本月排行榜
🥇
站長阿川
📝3   💬3   ❤️1
201
🥈
我愛JS
💬2  
7
🥉
Gigi
2
評分標準:發文×10 + 留言×3 + 獲讚×5 + 點讚×1 + 瀏覽數÷10
本數據每小時更新一次
📢 贊助商廣告 · 我要刊登