🔴 YT 直播問答！每週二晚上開講，開放觀眾 Call-in！ ➡️ 訂閱 YouTube 頻道 ➡️ 加入 Discord 社群

🔧 阿川の電商水電行

Shopify 顧問、維護與客製化

💡

小任務 / 單次支援方案

單次處理 Shopify 修正／微調

⭐️

維護方案

每月 Shopify 技術支援 + 小修改 + 諮詢

🚀

專案建置

Shopify 功能導入、培訓 + 分階段交付

👉 瞭解詳情 / 免費諮詢

小編精選 - 技術文章翻譯 · 06月30日

我的 8 小時現實檢定：使用 DeepSeek-R1-0528 進行編碼

我的 8 小時現實檢定：使用 DeepSeek-R1-0528 進行編碼

標題：“我的 8 小時現實檢定：使用 DeepSeek-R1-0528 進行編碼”

已發布：真實

描述：「DeepSeek-R1-0528 聲稱其推理能力可與 GPT 和 Claude 相媲美——它確實做到了，但也存在一些問題。這篇實戰評測深入了 8 小時的實際測試，揭示了這款開源 AI 模型的卓越之處和瓶頸。從延遲問題到架構優勢，DeepSeek何時閃耀光芒，何時會阻礙你的工作流程，我們將提供客觀的結論。

標籤：devops、程式設計、webdev、ai

canonical_url：「https://forgecode.dev/blog/deepseek-r1-0528-coding-experience-review/?utm\_source=devto&utm\_medium=blog&utm\_campaign=canonical\_url&utm\_content=canonical\_link」

TL;DR

DeepSeek-R1-0528：採用 MIT 授權的最新開源推理模型
重大突破：效能較上一版本顯著提升（AIME 2025 上為 87.5% vs 70%）
架構：總參數 671B，透過 Mixture-of-Experts 演算法，每個 token 約有 37B 個活躍參數
主要限制：透過 OpenRouter API 延遲 15-30 秒，而其他型號延遲約 1 秒
最適合：複雜推理、架構規劃、供應商獨立性
不適用於：即時編碼、快速迭代、互動式開發
結論：推理能力令人印象深刻，但延遲對實際應用構成挑戰

承諾與我的8小時現實檢驗

當我看到這條推文時：

{% twitter https://x.com/deepseek\_ai/status/1928061589107900779 %}

我的回答是：幫我拿好咖啡，測試這個「突破」…

劇透：如果你能等30秒才能收到回复，那就太棒了。而且，隨著你的上下文不斷加深，等待時間還會不斷延長。

在我除錯 Rust 非同步執行時 47 分鐘後，DeepSeek-R1-0528（透過我最喜歡的程式設計代理程式）終於給出了完美的解決方案。那時，我已經自己修復了 bug，喝了杯咖啡，開始質疑我的人生選擇。

以下是我經過 8 小時的測試後對最新「開源突破」的了解。

現實檢驗：炒作與我的實際體驗

DeepSeek 的公告承諾將帶來突破性的性能和實用的易用性。經過密集的測試，以下是這些說法的實證結果：

| DeepSeek 的聲明 | 我的現實 | 判決 |

|------------------------------------|-------------------------------------|---------|

| “與 GPT/Claude 的表現相匹配” | 推理能力經常超過它 | 正確 |

| “MIT 許可開源” | 完全開放，無限制 | 真實 |

| 「實質改進」 | 已確認主要基準收益 | 真實 |

突破是實實在在的。日常可用性…很有挑戰性。

在深入探討為什麼回應時間如此重要之前，讓我們先了解一下是什麼讓這個模型在技術上如此令人印象深刻，以至於儘管感到沮喪，我還是會繼續回來。

魔術背後的技術（以及它為何如此緩慢）

儘管我抱怨延遲，但在某些情況下等待是值得的：

完美的用例

大型程式碼庫分析（20,000+ 行）—完美利用 128K 上下文
建築規劃－深度推理證明等待時間是合理的
精確遵循指令－準確滿足您的要求
供應商獨立性－MIT 許可證支援自架

令人沮喪的用例

即時除錯——當它響應時，你已經修復了它
快速原型設計－終止迭代流程
學習/探索－等待會打斷學習的動力

推理透明度

這個「思考」過程確實令人印象深刻：

問題分析與方法規劃
邊緣情況考慮
解決方案驗證
輸出最佳化

不同的專家針對不同的模式（API 設計 vs 系統程式設計 vs 不安全程式碼）啟動。

深度搜尋

我的真實看法：歷史成就，現實挑戰

歷史性的成就

第一個真正具有競爭力的開放推理模型
MIT 許可證 = 完全獨立於供應商
證明開源可以匹敵封閉系統

每日現實

還記得那47分鐘的除錯過程嗎？它完美地詮釋了R1-0528的體驗：技術精湛，實踐挑戰。

問題不在於 R1-0528 是否令人印象深刻 - 它絕對令人印象深刻。

問題在於您是否可以圍繞等待天才的到來來建立您的工作流程。

🚀嘗試 AI Shell

>

您的智能編碼伴侶可無縫整合到您的工作流程中。

登入 Forge →

社區討論

在下面寫下您的經歷：

你測試過 R1-0528 的編碼嗎？你的耐心極限是多少？
找到解決延遲的方法了嗎？

底線

DeepSeek 的聲明在功能方面並沒有錯——基準改進是真實的，推理品質令人印象深刻，而且 MIT 許可證確實改變了遊戲規則。

建築規劃，哪裡等？絕對值得。

為了快速迭代？還沒到那一步。

請讓我知道您使用 DeepSeek R1 或其他 LLM 的經驗...

原文出處：https://dev.to/forgecode/my-8-hour-reality-check-coding-with-deepseek-r1-0528-2nic

小編精選 - 技術文章翻譯

精選技術文章翻譯，幫助開發者持續吸收新知。

0個讚 0留言 361瀏覽

共有 0 則留言

登入之後發表留言

文字內容提供幾種功能：
1) --- 會變成分隔線（上一行必須是空白）
2) # 會變成一級標題
3) ## 會變成二級標題
4) ### 會變成三級標題
5) **粗體文字**會顯示粗體文字
6) ```當第一行與最後一行會顯示程式碼
7) 請搜尋 Markdown 語法，了解各種格式

小編精選 - 技術文章翻譯

精選技術文章翻譯，幫助開發者持續吸收新知。

熱門文章

🔥 Google Gemini CLI 教學：如何安裝與使用（附圖片）

🔥 讓 Playwright MCP 探索您的網站並撰寫測試

🔥 【2025最新】Anthropic官方揭秘Claude 4 Prompts的12個優化技巧

🔥 從 58MB 到 2.6MB：我是如何將 React 官網效能提升 95% 的

🔥 非Docker容器引擎完全指南：從入門到實戰

🏆 本月排行榜

🥇

📝15 💬4 ❤️6

487

🥈

📝1 💬4 ❤️2

48

🥉

1

#4

1

#5

1

評分標準：發文×10 + 留言×3 + 獲讚×5 + 點讚×1 + 瀏覽數÷10

本數據每小時更新一次

🔧 阿川の電商水電行

Shopify 顧問、維護與客製化

💡

小任務 / 單次支援方案

單次處理 Shopify 修正／微調

⭐️

維護方案

每月 Shopify 技術支援 + 小修改 + 諮詢

🚀

專案建置

Shopify 功能導入、培訓 + 分階段交付

👉 瞭解詳情 / 免費諮詢

熱門搜尋：編輯 Javas project 嗎？ javasc 開發工作網站學習語言技術 Tailwind 程式作為套件 class error user Ts 第一ＣＳＳ分享設計軟體 TypeScript 平台 Python 遊戲分析 python 清單 Javascript javascript 風格使用 https local 研究 ') Github github import 架構今天 JavaScript 工程 console.log 資料作業測試公司 LA post Amazon typescript 伺服器乾淨 component 伺服按鈕推薦程師基礎結構開源 event react `) REACT 前端 console.log( node.js Typescript 入門改善 old 專案 java fetch model state 自學討論 docker 資料庫 VS Code JavaSCript 練習自學網頁の嬰兒教材 birdi search Openai devops Html request 路由 Java 資料夾 json first

CodeLove 愛寫扣論壇 © 2025

🛡️ 隱私及網站安全：本站註冊過程「不須提供任何個資」，只要 E-Mail 與帳密即可註冊，請安心註冊！線上付款過程使用「綠界科技 ECPay 」第三方專業金流廠商，全程在「綠界科技 ECPay 」網站進行付款程序，本站「不會紀錄任何信用卡資訊」，請放心付款、解鎖課程！您隨時可以透過 FB 粉專或者 Email 聯絡站長，請求刪除網站上的個人資料。

‹ › ×