Qwen3.7Max 測了一波有點用不起啊!

這幾天 Qwen3.7 的呼聲也挺高的,不少報導都說很強。印象比較深刻的是說「**國產最佳,世界第二**」!

我本來是不想碰 Qwen 系列的閉源模型了!

但是要求測一下的人很多,又成功激起了我的好奇心!

不得不說,Qwen 系列每次更新的封面圖還是挺好玩,也挺好看的!它們家的 Image 系列是不是好久沒開源了?

1、先看一波價格

我都準備開始測試了,但是找了半天,手上都沒有好的測試途徑。

之前買的 CodingPlan 還有 8 天到期,無法續費,也無法使用 Qwen3.7Max。買一個 TokensPlan 的話 198 元/月起跳,稍微好點就要 698 元/月!不太划算啊,我 Opus4.8 也才 140 元不到!

沒什麼好辦法,只能使用官方 API 了。

然後我就看到了下面的價目表:

輸入 12 元,輸出 36 元,換算成 2.4 元。這個價格……好像不便宜啊!還好現在 5 折,還能送個 100 萬 Tokens。

注意 100 萬 = 1M ~ 一個上下文的長度,不知道夠不夠塞牙縫!

2、看一波基準

開始測試之前呢,我們一般要先看看它們自己怎麼說的!

這麼一看,好像確實很厲害啊!

基本上全方位碾壓 DSV4、GLM5.1、Kimi K2.6,包括 Opus4.6Max!

下面是官方部落格核心描述:

diff 體驗 AI 代碼助手 代碼解讀複製代碼 Qwen3.7-Max 致力於成為全能的智能體基座——無論是編寫和調試代碼、自動化辦公流程,還是在跨越數百乃至數千步的長週期任務中持續自主執行,都能勝任。
​
Qwen3.7-Max 的核心優勢在於智能體能力的廣度與深度:
​
- 編程方面,從前端原型開發到複雜的多檔案工程均能駕馭;
- 辦公與生產力方面,透過 MCP 整合和多智能體協作實現工作流程自動化;
- 長週期自主執行方面,在一項長達 35 小時、超過 1,000 次工具調用的全自主核心優化實驗中保持了連貫推理,充分驗證了其持久穩定的執行能力;
- 此外,無論部署在 Claude Code、OpenClaw、Qwen Code 還是其他框架下,都能穩定發揮出色的跨框架泛化能力。
​
​

抓關鍵詞:「全能的智能體基座,核心優勢在智能體能力的廣度與深度」!

好了,基準、價格、賣點都看完了!開始測一波!

3、開始測試

Qwen 雖然是自家的工具,但是上場測試不是太理想,我還是統一用 Claude Code!

只要稍微設定一下就可以開幹了。

設定方式也很簡單,打開 JCode,新增設定:

填寫 API Key、BaseURL,新增 qwen3.7-max 模型,然後儲存!

然後一鍵呼叫 CC:

確認設定已經套用成功,然後開搞:

這次測試一個是建立一個叫《江湖百曉生》的網站!這個專案的測試背景,我已經在之前的幾篇文章中做了比較詳細的介紹。

因為這次 Qwen3.7Max 據說在前端方面表現出眾,競技場上排名前列。

所以這個專案也很合適,這個專案非常考驗資料處理能力、個性化設計,以及主題匹配度。

同時最近剛好測試了 Gemini3.5Flash、MiMo、Opus4.7,可以拿來做一個橫向對比。

4、結果對比

為了方便大家快速 GET 資訊,我就先上結果,再來說過程吧!

Qwen3.7Max 開發的網站首屏如下:

我第一眼看到,整體感覺還可以,小清新淡雅風格。

首先布局上是完全正確的,沒有混亂的地方,樣式、字體、配色中規中矩,找不出什麼大毛病,內容方面不多不少。

其實好不好,主要是看比較。

我們來看看其他選手的首屏。

下面是小米 MiMo2.5Pro 的效果:

下面是 Gemini3.5 做的效果:

下面是 Opus4.7 做的效果:

對比下來大家是什麼感受?

MiMo 是有點難看的,它的首輪結果無論布局,還是審美,亦或是資料都非常不理想,無法進一步評價了。

詳見:《小米 MiMo 花了 6400 萬 Tokens,結果有點難看!

Qwen3.7 的話整體沒任何問題,四平八穩。

但是感覺太平,太淡了!黑色按鈕偏現代風!配色不突出,字體不突出,每個頁面基本上看起來也差不多,沒有太多讓人眼前一亮的設計。

武俠最大的魅力就是「仗劍走江湖」,少不了路不平一聲吼,也少不了打打殺殺。太過平淡不符合主題!

首屏的描述也比較機械「縱覽金庸古龍武俠世界,收錄 35 部經典武俠小說,131 位江湖人物,101 門絕世武功,52 件傳世兵器」。

Gemini3.5 的話,整體來說比較奔放,充滿了情緒

字體和配色都很大膽。

這金、紅、黑配色是要點魄力的!

另外配文也很到位:

第一句點題:

知天下人、悉天下兵、辨天下武、記天下事

第二句是各種名言:

「桃花影落飛神劍,碧海潮生按玉簫。」 - 黃藥師《射鵰英雄傳》

我是很喜歡這種一句一句的,一句話,就能讓你想起一個人,想起一件事兒,悟出一個道理。

它標題的名字也挺有那味兒的。首頁叫「江湖首卷」。

它的藏書閣設計得也很有韻味:

把每一本書真的設計成了書的樣子,只是用簡單的幾條線就做到了。

另外還有專門的人物卡片,設計得也挺好的。

詳見:《Gemini3.5Flash “吊炸天”!還要啥設計師和前端

Opus 4.7 就是很精緻,很全面,很穩。

它連 tab 欄的小圖示都設計好了,頭部的字體也非常有武俠味兒,金庸古龍兩個主體也非常明顯。

「飛雪連天射白鹿,笑書神俠倚碧鴛」。

再配上這一段:

集金庸古龍兩宗筆耕於一閣。一者構千年江湖大勢,寫俠之大者;一者勾人性悲喜深處,狀孤獨浪子。自人物、武學、兵器、門派、地輿五脈而入,或尋一人之傳奇,或溯一派之淵源,皆有跡可循。

這段序文,很有功底。

各種包邊設計,就看起來精緻,很內斂。

Opus 4.7 這個「死變態」連武林地圖和年表都給搞出來了。

這個還可以新增長江黃河。還可以選門派、皇帝、名山、島嶼……選中每一個都有介紹!

Opus 不論做什麼系統,只要你要求到位,它都可以做出中上水平!而且是前端設計後端邏輯都沒有明顯短板。

詳見:《還沒發布~~》

厲害的選手,做出來的網頁,基本上是可以直接上線發布的!

比較菜的就得改很久,可能也改不好。

5、開發過程

結果已經看完了,我們來看看過程!

Qwen3.7Max 的過程整體來說還是比較穩健的。

得到需求之後成功啟動了 Plan 模式。然後從技術棧、資料來源、設計風格、資料格式等方面進行了詢問。

我基本上是根據它的推薦來做選擇:

這應該也是當前場景下的優選了!

其實計劃部分,現在的模型都可以做得不錯,包括 MiMo 也做得很好。就是執行環節完全拉了。

計劃的核心內容大致如下:

🏗️ 技術棧:Next.js + React + TypeScript + Tailwind CSS

🎨 設計風格:水墨古風(宣紙底色、墨色朱砂配色、毛筆字體)

📊 資料規模:金庸 15 部 + 古龍 20 部經典,每部整理人物/武功/兵器/場景

📄 頁面數量:約 10 種頁面類型,含人物關係圖譜等特色互動

💾 資料格式:結構化 JSON,約 80-100 個資料檔案

下面是它的執行過程和 Todo:

這個安排也是合理的!先基礎架構,然後蒐集資料,然後核心頁面開發,然後特殊功能開發,然後收尾驗收。

最終彙報如下:

全程消耗時間 38 分鐘!這個腦補的資料量來還可以,作為第一個開發測試版本是夠用的。

然後全程消耗 37 塊錢:

剛好 1 分鐘一塊錢的樣子。

我全程都沒有讓它上網抓資料,完全是讓它憑記憶寫的。但是這個消耗還是有點大的!

剛開始的 1M 免費配額秒沒,然後錢刷刷刷往上漲!我本來預估 10 塊錢封頂了,畢竟只是一輪測試而已。實際上達到了預期的 3 倍多,接近 4 倍。

所以第二輪我就不搞了,讓它完善資料的話,Tokens 又得狂飆!

有點用不起的感覺。

對比而言,DeepSeek 的話,我測了 N 多例子,才消耗了 20 多塊錢。價格差這麼多,能力並沒有那麼大的差距。

6、9 個前端測試

除了測試上面的專案之外,我也測試了很多其他例子。

比如我們有一套既有趣又有料的題目,總共是 9 個例子,每個例子都有專門的關注點。

比如賽博龐克版清明上河圖:

比如古詩版黑客帝國漢字雨:

比如華麗版人機對戰五子棋:

最後的測試結果是:9 個例子,翻車 1 個。翻車的是出現了 JS 錯誤!其中一個「分型煙花秀」開發過程多次卡死!

最終 8 個例子正常拿到結果,做得還不錯。整體來說頁面布局和設計感,確實中上水平。

當然這個可能跟我的生成環境也有關係。我是在 Qwen 官網的網頁設計功能裡生成的。可能系統提示詞優化!

掌門日記

另外我也測試了《掌門日記》。這個例子有點燒腦。

之前 MiMo 腦燒壞了,直接失敗。

Qwen3.7 成功顯示了首頁:

但是……出現了 JS 錯誤,導致輸入內容無效,無法進入主介面!

Uncaught SyntaxError: Missing } in template expression(括號沒有閉合)

看樣子還是不太穩,容易出現低級錯誤。

修復完成之後介面如下:

這個布局和風格還可以!

我感覺他的審美有一點 GPT5.5 的感覺,方方正正,略精緻,布局能力比 GPT5.5 應該要好一些!

而且這裡還有一個非常有意思的點,它生成網頁的時候,居然還配了背景圖片。 比如五子棋的棋盤、掌門日記的大背景和視窗背景!

我不確定它是基於什麼邏輯,但是生成圖片的風格和定位做得挺不錯的。

有圖片背景的話,有時候介面質感會提升一個檔次。

畢竟是 Max,能力還是可以的,介面也不錯!

但是,程式碼穩定性還有待提升,遇到幾個低級錯誤!

另外,現在厲害一點的模型,已經會深度分析需求了,並且和主題做完美的結合,具有較強的審美能力。

比如像 Opus4.7 和 Gemini3.6 在設計武俠百科的時候,會自動說一些很有武俠味兒的話,配上特殊的字體,在設計細節上也會很好地融入武俠風格。

這一方面,Qwen3.7 還比較粗,需要慢慢磨。

現在的模型,進步確實是很快的!

Qwen3.7 測起來還是挺無趣,沒有太大的槽點,但是也沒有那種眼前一亮的感覺。

再看看價格……不打折的話,我一次測試得 80 多?毫無性價比啊!

如果我手裡有 Opus4.8 Pro、GPT5.5 Plus、GLM5.1 專業版,還有便宜的 DeepSeek API 的話,我有什麼理由選它呢?因為它貴嗎!

其實這篇我前天就開始寫了,最近內容有點多,在排期。現在 Opus4.8 都來了,必須趕緊發掉,測試 Opus4.8 去了,週配額已經重置,兩天用一週的量有點爽。Claude 的專業版會員一個月也才 140 元不到啊。


原文出處:https://juejin.cn/post/7644794219849744394


精選技術文章翻譯,幫助開發者持續吸收新知。

共有 0 則留言


精選技術文章翻譯,幫助開發者持續吸收新知。
🏆 本月排行榜
🥇
站長阿川
📝12   💬4   ❤️1
464
🥈
alicec
📝1   ❤️2
87
#4
我愛JS
💬1  
3
評分標準:發文×10 + 留言×3 + 獲讚×5 + 點讚×1 + 瀏覽數÷10
本數據每小時更新一次
📢 贊助商廣告 · 我要刊登