小編精選 - 技術文章翻譯 · 07月01日

AI 的未來是本地化且開源的

每場黑客松總會發生一個特定的瞬間。通常是在凌晨 2、3 點左右，免費的能量飲料早就喝光了，Demo 還是半殘不壞，然後你團隊裡的某個人往折疊椅上一靠，問道：「等等……這真的能上線嗎？我們還有額度嗎？」

很長一段時間，這個問題的誠實答案都複雜得令人難以置信。最好的 AI 模型被鎖在嚴格的 API 後面，使用條款和存取條款讓商業化變得模糊不清，而 token 計價又讓週末的副業專案看起來財務上風險極高。你當然可以做出一個很酷的 Demo！但要把它變成真正的新創公司，卻是一次巨大的跨越。

開源不代表低效能

從歷史上來看，開源 AI 一直有點名聲問題。好幾年來，「開放」模型的意思就是「本地 Demo 夠用，但絕對不夠拿來正式生產環境」。Gemma 4——以及現今市面上的許多其他開源模型，例如 GLM-5.2——正在徹底打破這個天花板。我們是建立在與支撐旗艦 Gemini 模型相同的研究基礎上打造 Gemma 4，而且成果非常明顯。在複雜推理、多模態理解以及多語言任務上，Gemma 4 的表現遠遠超出你對一個可以自行下載並執行的模型所能期待的水準。

這個模型家族涵蓋了非常廣泛的尺寸，從小型的裝置端模型（2B）一路到能力強大的 26B MoE 與 31B dense 版本。更棒的是：你可以透過 Google AI Studio 的 Gemini API 免費存取較大型的 Gemma 4 變體。也就是說，你可以免費使用前沿等級的模型，在搞定計費權限之前，先原型開發、反覆迭代並驗證你的想法。

採用 Apache 2.0 授權

授權通常是開放權重 AI 變得混亂的地方，而且很快就會變得很麻煩。帶有暗藏商業限制、僅限研究用途條款，以及讓律師很愛吵架的署名要求的自訂授權——這些都是原本可能成為真正公司之黑客松專案的無聲殺手。

Gemma 4 採用 Apache 2.0 授權釋出。如果你在開源軟體世界待過一陣子，你就很清楚這代表什麼：你可以使用它、修改它、微調它，並在其上打造產品。你可以用它來創業。你可以用你新創公司的專有資料集微調 Gemma 4，將它作為軟體產品的核心部分釋出，而不必半夜驚醒去問律師你到底能不能這麼做。

對於那一代靠著拆解 GitHub 上的開源專案學會寫程式、現在又在打造自己第一間新創公司的開發者來說，這在理念上和實務上一樣重要。最好的工具應該提供給所有人——而不只是那些擁有大型企業合約的既有團隊。

到哪裡都能跑（真的！）

如果你的堆疊裡跑不起來，那世界上最好的模型也完全沒用。Google DeepMind 很清楚這一點，所以我們和正確的生態系夥伴合作，讓 Gemma 4 能在你真正想工作的地方到處可用：

Google AI Edge Gallery — 想在投入開發前先看看裝置端表現嗎？你現在就可以透過 Google AI Edge Gallery App 在 iOS 和 Android 上原生試用 Gemma。這是最適合用來驗證行動裝置友善版本是否快如閃電、是否已準備好迎接你下一個行動專案的方式。
Hugging Face 與 Transformers.js — 如果你連後端都不需要呢？多虧與 Hugging Face 生態系和 Transformers.js 的深度整合，你可以完全在客戶端執行 Gemma 4，直接透過 WebGPU 在瀏覽器中執行。沒有伺服器成本、沒有可能在公開 repo 中不小心外洩的 API 金鑰，而且零延遲。
Ollama — 用單一指令就能把 Gemma 4 拉到本地執行。離線開發、快速迭代，完全避開速率限制。如果你曾經在黑客松現場遇到 WiFi 不穩，卻拼命想連雲端 API 來做 Demo，你一定懂這件事為什麼重要。
Cerebras — 如果你需要接近即時的推論體驗，Cerebras 的晶粒規模（wafer-scale）晶片能以讓人感覺真的「即時」的速度產生 token。串流回應、低延遲代理、語音介面——Cerebras 加上 Gemma 4，會讓這些功能像是原生支援，而不是事後硬加上去的。
Unsloth — 以前微調大型語言模型需要龐大的算力叢集和創投預算。Unsloth 讓你能夠透過 Colab 或本地端，在單張消費級 GPU 上微調 Gemma 4，不只可行，而且快得驚人。客製化模型、領域特定效能、你的資料（而且不用啟動一個比你每月房租還貴的雲端訓練工作）。

這一切不是偶然發生的

Google DeepMind 一直有出現在黑客松現場：真正的那種，像是在大學體育館、共同工作空間、以及會議中心地下室舉辦的黑客松，因為 MLH 社群正是下一代 AI 工程師誕生的地方。

DeepMind 透過 MLH 贊助的 Gemini 與 Gemma 挑戰賽，已經觸及橫跨各大洲各場活動的黑客。這些是真正的技術挑戰，由那些想看看創作者在獲得強大工具、並且可以盡情發揮怪奇創意時會做出什麼的人的設計。那些從黑客松中誕生的專案——出乎意料的 RAG 應用、領域特定微調、以及那種「等等，你連這個都能做？」的硬體與機器人黑客作品——確實形塑了 DeepMind 對開發者需求的理解。