難受啊!
最近國產的 CodingPlan 全面收縮,不是轉成 TokenPlan 了,就是配額少得要命,動不動就是一個月 200 元。

要知道 OpenAI 的 GPT5.5 + Codex,也才 20 美金,能力比你們強一個級別,價格也才不到 140 RMB,配額還比你們多很多。
你們說怎麼選?
我來給你們分析一下現狀!

轟轟烈烈的國產模型「牛逼」之後,沒兩個月功夫,現在是個什麼情況了呢?
騰訊和阿里基本不搞 CodingPlan 了,全轉成 TokenPlan,按量計費,毫無性價比。
關鍵是毫無誠信,說換就換!
目前還能用的 CodingPlan 主要是火山方舟、智譜、MiniMax、Kimi。
火山方舟的問題是能力一般,配額一般。
智譜是能力不錯,配額也不錯,但是一般人估計買不到,另外也是一直在收縮配額。
MiniMax 價格和配額都還算良心,但是能力太一般了,當時宣稱自己是編程和 Agent SOTA,我現在終於悟了,得倒過來看。
Kimi 現在能力還行,但是配額少得可憐。
昨天晚上我統一測試了我手裡有的幾個 CodingPlan,結果真的一言難盡啊!

各有各的毛病,沒有一個順手的。
我就測試了兩個問題:
一個是讓它們幫我彙總一個現在最新的主流大模型 API 價目表。
一個是寫一篇 5 萬字、10 個章節的修仙小說。
下面就來看看各位選手的表現吧。
其實最近我對 Kimi 的印象還算不錯。至少它的「能力和宣傳比」要比其他模型好很多。
但是它也有它的問題。目前最大的問題是配額很少,能力不穩定。

下面來看一下具體的例子情況。
先看價目表的情況。

價格對不對我先不說,看到這個模型型號我就已經不相信它了。
現在是 2026 年 4 月 24 號,OpenAI 已經發布 GPT5.5 了,Anthropic 已經更新到 Opus4.7 了。
它的結果還停留在 GPT-4.5、Opus4。
這還不是最離譜的,國內模型阿里雲是 Qwen3-235B-A22B,還有什麼 360 智腦、華為盤古大模型 Pangu-Σ、天工 3.0、GLM-4-Air。
國外的你查不到也就算了,國內的也不知道?
我是開了網路權限的啊!
然後看看修仙小說的情況:

這個目錄和大綱是能看的,好像有點那個味兒,字數也符合要求,大概寫了 5 萬多字。
問題在於它還沒有儲存檔案,配額就消耗完了。
這是我手動從對話視窗裡複製出來,存到檔案裡的。
5 萬字大概消耗了 63% 的配額!
之前的表格整理花了 37% 的配額!
這些我都沒有任何修改需求啊,是直接跑一輪就消耗完的。
如果我對第一個表格不滿意,我提出一次修改意見的話,可能整個配額就沒了,沒有第二項測試了。
活幹得不漂亮,配額消耗得很快!
看完 Kimi 再來看一下火山。
下面是火山豆包的價目表:

這個表格幾乎和 Kimi 一個模子刻出來的。它認為目前 OpenAI 最新的模型是 GPT-4.5,主流模型是 GPT-4o。
Anthropic 的模型才更新到 Sonnet 3.7!
國產模型方面,也基本上是一個問題,太老了。
明明給了它們網路權限,它們為什麼就找不到最新的資料呢?還是完全沒有想過要去找?單純靠記憶?
火山比較好的一點是,做了頭部篩選,可以篩選廠商、地區和搜尋。
然後看一下小說部分:

其實小說光看標題都還可以,AI 最擅長的就是這種格式化的標題了,一字不差。
小說,主要還是看內容了。
我就不看了,我只是用它來測試 Token 消耗的。

火山的消耗比 Kimi 好很多,兩個任務完成大概只消耗了 15%。
火山豆包很長一段時間內首次連線延遲特別高,但是它完成一個整體專案的時間還是比較短的,也就是算是比較快的。
只是它的水準也就是勉強能用、適合大眾使用,作為 CodingPlan 顯然是不太夠用的。
然後我們再來看看最強智能體和編程模型 M2.7。
先看第一個例子:

所有人都交卷了,它還一直卡著,看了一下測試目錄,什麼都沒有生成!
我仔細查看了日誌檔:

發現開始沒多久它就因為 API 錯誤停工了!
最後停留在查詢 DeepSeek 價格這一個環節,然後就再也沒有請求了。
我看了一下我帳號後台的消耗情況,只呼叫了三次 API!!!
然後來看看寫小說的情況:

它寫的小說叫《天命道途》,是用 TXT 儲存不同的章節。
它有一個非常明顯的問題是,第一章的字數就不對。
我要求是每章 5000 字,它寫了 3990,誤差 20%。
兩個任務跑下來,配額沒消耗多少,它應該還是按次消耗,算是比較良心。
但是結果基本上處於不能用的狀態。它本身模型就小,整個智商確實「很感人」。
智譜在國內算是做得比較好的了,但是它也有它的問題。
先看價目表:

終於看到一個正常的了。
樓上各位看看人家的表現。
GLM5.1 正確取得到了最新的模型名稱。
GPT5.4 和 Claude Opus 4.7 確實是最新的模型了,昨天晚上 GPT5.5 還沒出來!

國內的資料也還可以,至少自家的模型基本都在了!
這一點上,GLM 就穩多了。
再來看看小說部分:

它的小說名字叫《逆天仙途》,怎麼看著有點眼熟呢?... 這個不重要!
重要的是,你們知道它為什麼只有 3 個章節嗎?
因為它寫了三章之後就卡住了,我也不知道它要寫到什麼時候。我實在受不了,就停了。
把模型換成 4.7 才順暢地把小說寫完,但是字數也不準。

說好的一章 5000 字,只寫了 1262 個字,加上標點符號也才 1415 個字。誤差 70%!
配額方面整體還好。
因為我是老套餐的 Pro 用戶,配額基本上沒有動過,就是 1%。
我看了下 Token 消耗了大概 100 萬多,所以 Pro 這個套餐量還是不少的。
問題是慢啊,5.1 完全不是正常速度,是很慢啊,4.7 又弱!
本來是興致勃勃地想測一下它們的套餐 Token 情況,但是出現了各種問題,所以搞得很無語。
刷基準測試的時候,個個都很厲害,真幹點活就各種問題。
要麼結果差得不行,要麼配額一下就沒了,要麼慢得要死,要麼所有毛病都有。
你們說,我圖啥呢!
要快、要強、要能幹有 Opus4.7;
要快、要強、要能幹、要配額有 GPT5.4。
這兩個也才 20 美金一個月啊,換算成人民幣不到 140。
現在國內的套餐 Pro 檔基本上就是 200 這個價位了。
現在 GPT5.5 也來了,能力只會比國產強,絕對不會比國產弱。

它還有自己的編程工具 Codex 終端版和桌面版。
它的桌面版已經做得很好了,現在包含了編程和日常兩種模式。
管理專案能力很強,操作電腦的能力也很強,有專門的 Computer Use 能力,直接操作本機軟體、操作瀏覽器。
關鍵人家配額也給力啊。

我拼命用也用不完,還動不動就重置。
你們看週配額才消耗了 10% 啊,5 小時配額基本都是滿血狀態,一般也就用到 10%~20%。
最後不禁要問一句,我拿真金白銀支持國產,國產拿什麼來回報我的?
用不停地修改套餐、縮減配額、低智的模型來回報我嗎?
剛剛看到群裡消息,DeepSeek V4 真的出了,我趕緊去看看,能否打破這種局面!