這幾天 Qwen3.7 的呼聲也挺高的,不少報導都說很強。印象比較深刻的是說「**國產最佳,世界第二**」!
我本來是不想碰 Qwen 系列的閉源模型了!
但是要求測一下的人很多,又成功激起了我的好奇心!

不得不說,Qwen 系列每次更新的封面圖還是挺好玩,也挺好看的!它們家的 Image 系列是不是好久沒開源了?
我都準備開始測試了,但是找了半天,手上都沒有好的測試途徑。
之前買的 CodingPlan 還有 8 天到期,無法續費,也無法使用 Qwen3.7Max。買一個 TokensPlan 的話 198 元/月起跳,稍微好點就要 698 元/月!不太划算啊,我 Opus4.8 也才 140 元不到!
沒什麼好辦法,只能使用官方 API 了。
然後我就看到了下面的價目表:

輸入 12 元,輸出 36 元,換算成 2.4 元。這個價格……好像不便宜啊!還好現在 5 折,還能送個 100 萬 Tokens。
注意 100 萬 = 1M ~ 一個上下文的長度,不知道夠不夠塞牙縫!
開始測試之前呢,我們一般要先看看它們自己怎麼說的!

這麼一看,好像確實很厲害啊!
基本上全方位碾壓 DSV4、GLM5.1、Kimi K2.6,包括 Opus4.6Max!
下面是官方部落格核心描述:
diff 體驗 AI 代碼助手 代碼解讀複製代碼 Qwen3.7-Max 致力於成為全能的智能體基座——無論是編寫和調試代碼、自動化辦公流程,還是在跨越數百乃至數千步的長週期任務中持續自主執行,都能勝任。
Qwen3.7-Max 的核心優勢在於智能體能力的廣度與深度:
- 編程方面,從前端原型開發到複雜的多檔案工程均能駕馭;
- 辦公與生產力方面,透過 MCP 整合和多智能體協作實現工作流程自動化;
- 長週期自主執行方面,在一項長達 35 小時、超過 1,000 次工具調用的全自主核心優化實驗中保持了連貫推理,充分驗證了其持久穩定的執行能力;
- 此外,無論部署在 Claude Code、OpenClaw、Qwen Code 還是其他框架下,都能穩定發揮出色的跨框架泛化能力。
抓關鍵詞:「全能的智能體基座,核心優勢在智能體能力的廣度與深度」!
好了,基準、價格、賣點都看完了!開始測一波!
Qwen 雖然是自家的工具,但是上場測試不是太理想,我還是統一用 Claude Code!
只要稍微設定一下就可以開幹了。
設定方式也很簡單,打開 JCode,新增設定:
填寫 API Key、BaseURL,新增 qwen3.7-max 模型,然後儲存!
然後一鍵呼叫 CC:

確認設定已經套用成功,然後開搞:

這次測試一個是建立一個叫《江湖百曉生》的網站!這個專案的測試背景,我已經在之前的幾篇文章中做了比較詳細的介紹。
因為這次 Qwen3.7Max 據說在前端方面表現出眾,競技場上排名前列。

所以這個專案也很合適,這個專案非常考驗資料處理能力、個性化設計,以及主題匹配度。
同時最近剛好測試了 Gemini3.5Flash、MiMo、Opus4.7,可以拿來做一個橫向對比。
為了方便大家快速 GET 資訊,我就先上結果,再來說過程吧!
Qwen3.7Max 開發的網站首屏如下:

我第一眼看到,整體感覺還可以,小清新淡雅風格。
首先布局上是完全正確的,沒有混亂的地方,樣式、字體、配色中規中矩,找不出什麼大毛病,內容方面不多不少。
其實好不好,主要是看比較。
我們來看看其他選手的首屏。
下面是小米 MiMo2.5Pro 的效果:

下面是 Gemini3.5 做的效果:

下面是 Opus4.7 做的效果:

對比下來大家是什麼感受?
MiMo 是有點難看的,它的首輪結果無論布局,還是審美,亦或是資料都非常不理想,無法進一步評價了。
詳見:《小米 MiMo 花了 6400 萬 Tokens,結果有點難看!》
Qwen3.7 的話整體沒任何問題,四平八穩。
但是感覺太平,太淡了!黑色按鈕偏現代風!配色不突出,字體不突出,每個頁面基本上看起來也差不多,沒有太多讓人眼前一亮的設計。
武俠最大的魅力就是「仗劍走江湖」,少不了路不平一聲吼,也少不了打打殺殺。太過平淡不符合主題!
首屏的描述也比較機械「縱覽金庸古龍武俠世界,收錄 35 部經典武俠小說,131 位江湖人物,101 門絕世武功,52 件傳世兵器」。
Gemini3.5 的話,整體來說比較奔放,充滿了情緒!
字體和配色都很大膽。
這金、紅、黑配色是要點魄力的!
另外配文也很到位:
第一句點題:
「知天下人、悉天下兵、辨天下武、記天下事」
第二句是各種名言:
「桃花影落飛神劍,碧海潮生按玉簫。」 - 黃藥師《射鵰英雄傳》
我是很喜歡這種一句一句的,一句話,就能讓你想起一個人,想起一件事兒,悟出一個道理。
它標題的名字也挺有那味兒的。首頁叫「江湖首卷」。
它的藏書閣設計得也很有韻味:

把每一本書真的設計成了書的樣子,只是用簡單的幾條線就做到了。
另外還有專門的人物卡片,設計得也挺好的。
詳見:《Gemini3.5Flash “吊炸天”!還要啥設計師和前端》
Opus 4.7 就是很精緻,很全面,很穩。
它連 tab 欄的小圖示都設計好了,頭部的字體也非常有武俠味兒,金庸古龍兩個主體也非常明顯。
「飛雪連天射白鹿,笑書神俠倚碧鴛」。
再配上這一段:
集金庸古龍兩宗筆耕於一閣。一者構千年江湖大勢,寫俠之大者;一者勾人性悲喜深處,狀孤獨浪子。自人物、武學、兵器、門派、地輿五脈而入,或尋一人之傳奇,或溯一派之淵源,皆有跡可循。
這段序文,很有功底。
各種包邊設計,就看起來精緻,很內斂。
Opus 4.7 這個「死變態」連武林地圖和年表都給搞出來了。

這個還可以新增長江黃河。還可以選門派、皇帝、名山、島嶼……選中每一個都有介紹!
Opus 不論做什麼系統,只要你要求到位,它都可以做出中上水平!而且是前端設計後端邏輯都沒有明顯短板。
詳見:《還沒發布~~》
厲害的選手,做出來的網頁,基本上是可以直接上線發布的!
比較菜的就得改很久,可能也改不好。
結果已經看完了,我們來看看過程!
Qwen3.7Max 的過程整體來說還是比較穩健的。
得到需求之後成功啟動了 Plan 模式。然後從技術棧、資料來源、設計風格、資料格式等方面進行了詢問。

我基本上是根據它的推薦來做選擇:

這應該也是當前場景下的優選了!
其實計劃部分,現在的模型都可以做得不錯,包括 MiMo 也做得很好。就是執行環節完全拉了。
計劃的核心內容大致如下:
🏗️ 技術棧:Next.js + React + TypeScript + Tailwind CSS
🎨 設計風格:水墨古風(宣紙底色、墨色朱砂配色、毛筆字體)
📊 資料規模:金庸 15 部 + 古龍 20 部經典,每部整理人物/武功/兵器/場景
📄 頁面數量:約 10 種頁面類型,含人物關係圖譜等特色互動
💾 資料格式:結構化 JSON,約 80-100 個資料檔案
下面是它的執行過程和 Todo:

這個安排也是合理的!先基礎架構,然後蒐集資料,然後核心頁面開發,然後特殊功能開發,然後收尾驗收。
最終彙報如下:

全程消耗時間 38 分鐘!這個腦補的資料量來還可以,作為第一個開發測試版本是夠用的。
然後全程消耗 37 塊錢:

剛好 1 分鐘一塊錢的樣子。
我全程都沒有讓它上網抓資料,完全是讓它憑記憶寫的。但是這個消耗還是有點大的!
剛開始的 1M 免費配額秒沒,然後錢刷刷刷往上漲!我本來預估 10 塊錢封頂了,畢竟只是一輪測試而已。實際上達到了預期的 3 倍多,接近 4 倍。
所以第二輪我就不搞了,讓它完善資料的話,Tokens 又得狂飆!
有點用不起的感覺。
對比而言,DeepSeek 的話,我測了 N 多例子,才消耗了 20 多塊錢。價格差這麼多,能力並沒有那麼大的差距。
除了測試上面的專案之外,我也測試了很多其他例子。

比如我們有一套既有趣又有料的題目,總共是 9 個例子,每個例子都有專門的關注點。
比如賽博龐克版清明上河圖:

比如古詩版黑客帝國漢字雨:

比如華麗版人機對戰五子棋:

最後的測試結果是:9 個例子,翻車 1 個。翻車的是出現了 JS 錯誤!其中一個「分型煙花秀」開發過程多次卡死!
最終 8 個例子正常拿到結果,做得還不錯。整體來說頁面布局和設計感,確實中上水平。
當然這個可能跟我的生成環境也有關係。我是在 Qwen 官網的網頁設計功能裡生成的。可能系統提示詞優化!
另外我也測試了《掌門日記》。這個例子有點燒腦。

之前 MiMo 腦燒壞了,直接失敗。
Qwen3.7 成功顯示了首頁:

但是……出現了 JS 錯誤,導致輸入內容無效,無法進入主介面!
Uncaught SyntaxError: Missing } in template expression(括號沒有閉合)
看樣子還是不太穩,容易出現低級錯誤。
修復完成之後介面如下:

這個布局和風格還可以!
我感覺他的審美有一點 GPT5.5 的感覺,方方正正,略精緻,布局能力比 GPT5.5 應該要好一些!
而且這裡還有一個非常有意思的點,它生成網頁的時候,居然還配了背景圖片。 比如五子棋的棋盤、掌門日記的大背景和視窗背景!
我不確定它是基於什麼邏輯,但是生成圖片的風格和定位做得挺不錯的。
有圖片背景的話,有時候介面質感會提升一個檔次。
畢竟是 Max,能力還是可以的,介面也不錯!
但是,程式碼穩定性還有待提升,遇到幾個低級錯誤!
另外,現在厲害一點的模型,已經會深度分析需求了,並且和主題做完美的結合,具有較強的審美能力。
比如像 Opus4.7 和 Gemini3.6 在設計武俠百科的時候,會自動說一些很有武俠味兒的話,配上特殊的字體,在設計細節上也會很好地融入武俠風格。
這一方面,Qwen3.7 還比較粗,需要慢慢磨。
現在的模型,進步確實是很快的!
Qwen3.7 測起來還是挺無趣,沒有太大的槽點,但是也沒有那種眼前一亮的感覺。
再看看價格……不打折的話,我一次測試得 80 多?毫無性價比啊!
如果我手裡有 Opus4.8 Pro、GPT5.5 Plus、GLM5.1 專業版,還有便宜的 DeepSeek API 的話,我有什麼理由選它呢?因為它貴嗎!
其實這篇我前天就開始寫了,最近內容有點多,在排期。現在 Opus4.8 都來了,必須趕緊發掉,測試 Opus4.8 去了,週配額已經重置,兩天用一週的量有點爽。Claude 的專業版會員一個月也才 140 元不到啊。