小編精選 - 技術文章翻譯 · 06月01日

Qwen3.7Max 測了一波有點用不起啊！

這幾天 Qwen3.7 的呼聲也挺高的，不少報導都說很強。印象比較深刻的是說「**國產最佳，世界第二**」！

我本來是不想碰 Qwen 系列的閉源模型了！

但是要求測一下的人很多，又成功激起了我的好奇心！

不得不說，Qwen 系列每次更新的封面圖還是挺好玩，也挺好看的！它們家的 Image 系列是不是好久沒開源了？

1、先看一波價格

我都準備開始測試了，但是找了半天，手上都沒有好的測試途徑。

之前買的 CodingPlan 還有 8 天到期，無法續費，也無法使用 Qwen3.7Max。買一個 TokensPlan 的話 198 元／月起跳，稍微好點就要 698 元／月！不太划算啊，我 Opus4.8 也才 140 元不到！

沒什麼好辦法，只能使用官方 API 了。

然後我就看到了下面的價目表：

輸入 12 元，輸出 36 元，換算成 2.4 元。這個價格……好像不便宜啊！還好現在 5 折，還能送個 100 萬 Tokens。

注意 100 萬 = 1M ~ 一個上下文的長度，不知道夠不夠塞牙縫！

2、看一波基準

開始測試之前呢，我們一般要先看看它們自己怎麼說的！

這麼一看，好像確實很厲害啊！

基本上全方位碾壓 DSV4、GLM5.1、Kimi K2.6，包括 Opus4.6Max！

下面是官方部落格核心描述：

diff 體驗 AI 代碼助手 代碼解讀複製代碼 Qwen3.7-Max 致力於成為全能的智能體基座——無論是編寫和調試代碼、自動化辦公流程，還是在跨越數百乃至數千步的長週期任務中持續自主執行，都能勝任。

Qwen3.7-Max 的核心優勢在於智能體能力的廣度與深度：

- 編程方面，從前端原型開發到複雜的多檔案工程均能駕馭；
- 辦公與生產力方面，透過 MCP 整合和多智能體協作實現工作流程自動化；
- 長週期自主執行方面，在一項長達 35 小時、超過 1,000 次工具調用的全自主核心優化實驗中保持了連貫推理，充分驗證了其持久穩定的執行能力；
- 此外，無論部署在 Claude Code、OpenClaw、Qwen Code 還是其他框架下，都能穩定發揮出色的跨框架泛化能力。

抓關鍵詞：「全能的智能體基座，核心優勢在智能體能力的廣度與深度」！

好了，基準、價格、賣點都看完了！開始測一波！

3、開始測試

Qwen 雖然是自家的工具，但是上場測試不是太理想，我還是統一用 Claude Code！

只要稍微設定一下就可以開幹了。

設定方式也很簡單，打開 JCode，新增設定：

填寫 API Key、BaseURL，新增 qwen3.7-max 模型，然後儲存！

然後一鍵呼叫 CC：

確認設定已經套用成功，然後開搞：

這次測試一個是建立一個叫《江湖百曉生》的網站！這個專案的測試背景，我已經在之前的幾篇文章中做了比較詳細的介紹。

因為這次 Qwen3.7Max 據說在前端方面表現出眾，競技場上排名前列。

所以這個專案也很合適，這個專案非常考驗資料處理能力、個性化設計，以及主題匹配度。

同時最近剛好測試了 Gemini3.5Flash、MiMo、Opus4.7，可以拿來做一個橫向對比。

4、結果對比

為了方便大家快速 GET 資訊，我就先上結果，再來說過程吧！

Qwen3.7Max 開發的網站首屏如下：

我第一眼看到，整體感覺還可以，小清新淡雅風格。

首先布局上是完全正確的，沒有混亂的地方，樣式、字體、配色中規中矩，找不出什麼大毛病，內容方面不多不少。

其實好不好，主要是看比較。

我們來看看其他選手的首屏。

下面是小米 MiMo2.5Pro 的效果：

下面是 Gemini3.5 做的效果：

下面是 Opus4.7 做的效果：

對比下來大家是什麼感受？

MiMo 是有點難看的，它的首輪結果無論布局，還是審美，亦或是資料都非常不理想，無法進一步評價了。

詳見：《小米 MiMo 花了 6400 萬 Tokens，結果有點難看！》

Qwen3.7 的話整體沒任何問題，四平八穩。

但是感覺太平，太淡了！黑色按鈕偏現代風！配色不突出，字體不突出，每個頁面基本上看起來也差不多，沒有太多讓人眼前一亮的設計。

武俠最大的魅力就是「仗劍走江湖」，少不了路不平一聲吼，也少不了打打殺殺。太過平淡不符合主題！

首屏的描述也比較機械「縱覽金庸古龍武俠世界，收錄 35 部經典武俠小說，131 位江湖人物，101 門絕世武功，52 件傳世兵器」。

Gemini3.5 的話，整體來說比較奔放，充滿了情緒！

字體和配色都很大膽。

這金、紅、黑配色是要點魄力的！

另外配文也很到位：

第一句點題：

「知天下人、悉天下兵、辨天下武、記天下事」

第二句是各種名言：

「桃花影落飛神劍，碧海潮生按玉簫。」 - 黃藥師《射鵰英雄傳》

我是很喜歡這種一句一句的，一句話，就能讓你想起一個人，想起一件事兒，悟出一個道理。

它標題的名字也挺有那味兒的。首頁叫「江湖首卷」。

它的藏書閣設計得也很有韻味：

把每一本書真的設計成了書的樣子，只是用簡單的幾條線就做到了。

另外還有專門的人物卡片，設計得也挺好的。

詳見：《Gemini3.5Flash “吊炸天”！還要啥設計師和前端》

Opus 4.7 就是很精緻，很全面，很穩。

它連 tab 欄的小圖示都設計好了，頭部的字體也非常有武俠味兒，金庸古龍兩個主體也非常明顯。

「飛雪連天射白鹿，笑書神俠倚碧鴛」。

再配上這一段：

集金庸古龍兩宗筆耕於一閣。一者構千年江湖大勢，寫俠之大者；一者勾人性悲喜深處，狀孤獨浪子。自人物、武學、兵器、門派、地輿五脈而入，或尋一人之傳奇，或溯一派之淵源，皆有跡可循。

這段序文，很有功底。

各種包邊設計，就看起來精緻，很內斂。

Opus 4.7 這個「死變態」連武林地圖和年表都給搞出來了。

這個還可以新增長江黃河。還可以選門派、皇帝、名山、島嶼……選中每一個都有介紹！

Opus 不論做什麼系統，只要你要求到位，它都可以做出中上水平！而且是前端設計後端邏輯都沒有明顯短板。

詳見：《還沒發布~~》

厲害的選手，做出來的網頁，基本上是可以直接上線發布的！

比較菜的就得改很久，可能也改不好。

5、開發過程

結果已經看完了，我們來看看過程！

Qwen3.7Max 的過程整體來說還是比較穩健的。

得到需求之後成功啟動了 Plan 模式。然後從技術棧、資料來源、設計風格、資料格式等方面進行了詢問。

我基本上是根據它的推薦來做選擇：

這應該也是當前場景下的優選了！

其實計劃部分，現在的模型都可以做得不錯，包括 MiMo 也做得很好。就是執行環節完全拉了。

計劃的核心內容大致如下：

🏗️ 技術棧：Next.js + React + TypeScript + Tailwind CSS

🎨 設計風格：水墨古風（宣紙底色、墨色朱砂配色、毛筆字體）

📊 資料規模：金庸 15 部 + 古龍 20 部經典，每部整理人物／武功／兵器／場景

📄 頁面數量：約 10 種頁面類型，含人物關係圖譜等特色互動

💾 資料格式：結構化 JSON，約 80-100 個資料檔案

下面是它的執行過程和 Todo：

這個安排也是合理的！先基礎架構，然後蒐集資料，然後核心頁面開發，然後特殊功能開發，然後收尾驗收。

最終彙報如下：

全程消耗時間 38 分鐘！這個腦補的資料量來還可以，作為第一個開發測試版本是夠用的。

然後全程消耗 37 塊錢：

剛好 1 分鐘一塊錢的樣子。

我全程都沒有讓它上網抓資料，完全是讓它憑記憶寫的。但是這個消耗還是有點大的！

剛開始的 1M 免費配額秒沒，然後錢刷刷刷往上漲！我本來預估 10 塊錢封頂了，畢竟只是一輪測試而已。實際上達到了預期的 3 倍多，接近 4 倍。

所以第二輪我就不搞了，讓它完善資料的話，Tokens 又得狂飆！

有點用不起的感覺。

對比而言，DeepSeek 的話，我測了 N 多例子，才消耗了 20 多塊錢。價格差這麼多，能力並沒有那麼大的差距。

6、9 個前端測試

除了測試上面的專案之外，我也測試了很多其他例子。

比如我們有一套既有趣又有料的題目，總共是 9 個例子，每個例子都有專門的關注點。

比如賽博龐克版清明上河圖：

比如古詩版黑客帝國漢字雨：

比如華麗版人機對戰五子棋：

最後的測試結果是：9 個例子，翻車 1 個。翻車的是出現了 JS 錯誤！其中一個「分型煙花秀」開發過程多次卡死！

最終 8 個例子正常拿到結果，做得還不錯。整體來說頁面布局和設計感，確實中上水平。

當然這個可能跟我的生成環境也有關係。我是在 Qwen 官網的網頁設計功能裡生成的。可能系統提示詞優化！

掌門日記

另外我也測試了《掌門日記》。這個例子有點燒腦。

之前 MiMo 腦燒壞了，直接失敗。

Qwen3.7 成功顯示了首頁：

但是……出現了 JS 錯誤，導致輸入內容無效，無法進入主介面！

Uncaught SyntaxError: Missing } in template expression（括號沒有閉合）

看樣子還是不太穩，容易出現低級錯誤。

修復完成之後介面如下：

這個布局和風格還可以！

我感覺他的審美有一點 GPT5.5 的感覺，方方正正，略精緻，布局能力比 GPT5.5 應該要好一些！

而且這裡還有一個非常有意思的點，它生成網頁的時候，居然還配了背景圖片。 比如五子棋的棋盤、掌門日記的大背景和視窗背景！

我不確定它是基於什麼邏輯，但是生成圖片的風格和定位做得挺不錯的。

有圖片背景的話，有時候介面質感會提升一個檔次。

畢竟是 Max，能力還是可以的，介面也不錯！

但是，程式碼穩定性還有待提升，遇到幾個低級錯誤！

另外，現在厲害一點的模型，已經會深度分析需求了，並且和主題做完美的結合，具有較強的審美能力。

比如像 Opus4.7 和 Gemini3.6 在設計武俠百科的時候，會自動說一些很有武俠味兒的話，配上特殊的字體，在設計細節上也會很好地融入武俠風格。

這一方面，Qwen3.7 還比較粗，需要慢慢磨。

現在的模型，進步確實是很快的！

Qwen3.7 測起來還是挺無趣，沒有太大的槽點，但是也沒有那種眼前一亮的感覺。

再看看價格……不打折的話，我一次測試得 80 多？毫無性價比啊！

如果我手裡有 Opus4.8 Pro、GPT5.5 Plus、GLM5.1 專業版，還有便宜的 DeepSeek API 的話，我有什麼理由選它呢？因為它貴嗎！

其實這篇我前天就開始寫了，最近內容有點多，在排期。現在 Opus4.8 都來了，必須趕緊發掉，測試 Opus4.8 去了，週配額已經重置，兩天用一週的量有點爽。Claude 的專業版會員一個月也才 140 元不到啊。

原文出處：https://juejin.cn/post/7644794219849744394

小編精選 - 技術文章翻譯

精選技術文章翻譯，幫助開發者持續吸收新知。

0個讚 0留言 274瀏覽

共有 0 則留言

登入之後發表留言

文字內容提供幾種功能：
1) --- 會變成分隔線（上一行必須是空白）
2) # 會變成一級標題
3) ## 會變成二級標題
4) ### 會變成三級標題
5) **粗體文字**會顯示粗體文字
6) ```當第一行與最後一行會顯示程式碼
7) 請搜尋 Markdown 語法，了解各種格式

小編精選 - 技術文章翻譯

精選技術文章翻譯，幫助開發者持續吸收新知。

🏆 本月排行榜

🥇

站長阿川

📝8 💬2 ❤️5

244

🥈

我愛JS

📝2 💬6 ❤️3

111

評分標準：發文×10 + 留言×3 + 獲讚×5 + 點讚×1 + 瀏覽數÷10

本數據每小時更新一次