1%

1%


title: 1%
published: true
description: "聖塔克拉拉,2029 年。一則關於霸權、制裁,以及沒有人遵循的作戰手冊的推想式小說。"
tags: ai, geopolitics, hardware, fiction
cover_image: https://dev-to-uploads.s3.us-east-2.amazonaws.com/uploads/articles/9zz142ganotzkc32mhne.png
published_at: current

聖塔克拉拉,2029 年 3 月 14 日。

Jensen 桌上有四樣東西。

一份 NSA 報告,正面朝下。

Kai Chen 的辨識證。

一支 iPhone,螢幕亮著:「白宮」。

以及牆上那張自 2019 年起就裱框掛著的 GeForce 256,手寫簽名寫著:「一切的起點——1999。」

Jensen 沒有看那幅框畫。

他看著眼前螢幕上的數字。

1%。

全球推論資料中心市場占有率。百分之一。

美國本土 12%——封閉型超大規模雲端業者、聯邦合約、深埋在 CUDA 裡、根本搬不走的企業堆疊。

伊朗。

他回想起 2023 年 11 月。參議院。自己的聲音:「這些限制只會加速他們自家晶片的發展。」

沒人聽。

最後,連他自己也沒有再說下去。他其實早就知道。他選擇了沉默——選對關係、選對分得的那塊餅。那種很賺錢的沉默。

走廊上沒關的螢幕傳來一個熟悉的聲音:

「我們一直在贏。我們永遠都在贏。其他一切都是假新聞。」

Jensen 起身,離開時順手關掉螢幕。


他拿起 Kai Chen 的辨識證。

在 nVidia 待了十二年。Hopper 推論引擎的首席架構師。離職訊息很短:「新的機會。」LinkedIn 顯示成都。

辨識證堆積得比新進員工補得還快。他不是第一個,也不會是最後一個。

來自華盛頓的聲音,是幾週前:

「叛徒。廢物。他們最後都會爬回來。」

但他們都沒有。

Jensen 把辨識證放下。


他看著那份 NSA 報告。

沒有翻面。

HX-9 Pro 於 2028 年 10 月出貨。18 顆 ARM 核心。512GB 焊接式 xGDDR8——這是一種共同開發給大型語言模型推論工作負載的記憶體變體,而標準 GDDR8 仍主要鎖定圖形渲染。210 瓦 TDP。7,800 美元。成都製造,檳城組裝,全球販售。

除了這裡。

三週前,俄亥俄州的一座第二級資料中心悄悄換掉了最後一組 nVidia 機櫃。遷移只花了一個週末。

今天早上,舊金山某處,一位 CTO 打開了 Signal。

「你們報價多少?」

柏林二十秒後回覆。

「811,000。」

那位 CTO 螢幕上的報價是 4,032,000 美元。相同的運算能力。相同的工作負載。相同的輸出。

針對亞洲零元件的 500% 關稅,早就不再保護任何東西了。它們只是在課美國人的稅。

Intel 和 AMD 也有自己的版本——ARM、xGDDR8、NPU 叢集、開放式堆疊。紙面上很有競爭力。生產於檳城與台灣。卻也被同樣的關稅波及,因為它們自己的零元件是在華府其實已經無法真正掌控的海外晶圓廠製造的。美國本土市占率分別是 19% 和 23%——雖然都領先 nVidia,但原因並不那麼光彩,沒有人在董事會裡覺得特別值得驕傲。

一切都在這裡。


Jensen 站在 GeForce 256 前。

1999 年。那顆開啟一切的 GPU——第一次把幾何轉換與光照做進硬體。競爭對手都笑了。3dfx。S3。Matrox。六個月後,nVidia 一個一個把他們埋了。

他知道這個故事。

他曾站在另一邊經歷過。

2026 年。商務部公布對 Fable 5 與 Mythos 5 的限制措施。星期五。下午 5:21。

三十小時後,智譜推出 GLM-5.2。7440 億參數。一百萬 token 的上下文視窗。MIT 授權。開放權重。無地理限制。

三十小時。

Sakana AI 在接下來那一週推出 Fugu——一個把最佳可用模型聚合到單一 API 後面的協調器。工程基準的表現可與 Fable 5 相當。每月二十美元。

來自華盛頓的聲音震遍每一塊螢幕:

「我們的技術是全世界最好的。最好的。沒有人能追上我們。沒有人。」

GLM-5.2 已經上線十八小時。

在聖塔克拉拉的董事會裡,這訊息被記下來。

什麼都沒變。

一切都在這裡。


2025 年。Apple 推出 M4 Ultra。512GB 統一記憶體。200 瓦。在本機上跑 700 億參數推論,毫不費力。這就是一顆搭載大容量記憶體的 ARM 加速器可以變成什麼樣子的藍圖——原本是為 Final Cut Pro 和 Xcode 設計,結果被拿來在桌機上跑前沿模型。

Apple 並不是想向 nVidia 證明什麼。那只是副作用。

同年,Moffett AI 公布其 MLPerf Inference 成績。S30:吞吐量是 H100 的兩倍。耗電量只有三分之一。中國製造,基於稀疏化架構,而聖塔克拉拉沒有人把這件事當一回事。

ROCm 9.x 也在。開源、MIT 授權、原生 PyTorch。H100 推論效能的 90%——在 nVidia 硬體上。HX-9 Pro 上則是 600%。

1998 年,Microsoft 看著第一批 Linux 伺服器基準測試時,也曾笑過。

一切都在這裡。


2023 年。DeepSeek 推出 R1。訓練成本:600 萬美元。不是 1 億美元。是 600 萬——用的是他們原本被拒絕取得的晶片,在硬體無法優化的地方,改去優化演算法。

限制會產生創新。
充裕會產生依賴。

在華盛頓的一間危機應變室裡,一名分析師正描繪一條曲線。

「他們正在放慢。」

沒有人反對。

那條曲線還會持續上升十八個月。

Jensen 早就知道。他曾在參議院面前說過。當時房間裡的一位國安顧問對鄰座低聲說:「如果我們什麼都不做,他們會立刻拿到最好的晶片;如果我們採取行動,我們可能會加速他們自己的產業。不管怎樣,風險都是真實存在的。」

參議員們點了頭,最後還是投票通過了限制。

Jensen 搭機回到聖塔克拉拉。以每顆 4 萬美元的價格賣出 H100。那是其他任何產業都不敢開出的利潤。

理性。短期。

一切都在這裡。


2022 年。工業與安全局。實體清單。H100、A100、H800——一項接一項逐步封鎖。ASML 被禁止交付 EUV 機台。ARM 也被施壓,限制其授權物件。

目的:維持技術霸權。保住領先。鞏固控制。

前例已經存在。它有個名字。

AMD。

1982 年:IBM 逼 Intel 授權 x86。Intel 同意了,因為它相信 AMD 會永遠只是跟隨者。1993 年:K5 開始讓他們感到不安。1999 年:Athlon K7 在整數基準測試上把 Pentium III 打得潰不成軍。Intel 當時的內部備忘錄到現在都還在——工程師從 1996 年起就一直在拉警報。NetBurst 在公開發表之前,就已經被認定是條死路。2003 年:Opteron。後來帶向 Zen 的早期架構——以及伺服器市場的主導地位。Intel 到 2006 年才靠 Core 架構扳回一城——但那已經太晚,挽不回形象;再晚十年,連伺服器市占都搶不回來。

AMD 不需要發明新架構。它只是拿著既有架構,把 Intel 不再看的地方做到最好,然後用更便宜的價格賣給所有被 Intel 定價排除在外的人。

這套作法是眾所周知的。被教過。被記錄過。

一切都在這裡。


聖塔克拉拉,2029 年 3 月 14 日。

Jensen 走向窗邊。

下方的 101 州際公路,在這個時段看起來一片清楚。

他想起某個人在成都、某個 2024 年的工程師,看著 M4 Ultra 規格,精準地理解了該做出什麼樣的東西。

iPhone 已經不再震動。

NSA 報告仍然正面朝下放在桌上。

GeForce 256 依舊掛在牆上。

「一切的起點。」

螢幕上,游標閃爍。

台灣海峽。

他沒有把那個念頭想完。

1%。


原文出處:https://dev.to/pascal_cescato_692b7a8a20/1-15n0


精選技術文章翻譯,幫助開發者持續吸收新知。

共有 0 則留言


精選技術文章翻譯,幫助開發者持續吸收新知。
🏆 本月排行榜
🥇
站長阿川
📝13   💬2   ❤️1
571
🥈
我愛JS
📝1   ❤️1
71
評分標準:發文×10 + 留言×3 + 獲讚×5 + 點讚×1 + 瀏覽數÷10
本數據每小時更新一次
📢 贊助商廣告 · 我要刊登