小編精選 - 技術文章翻譯 · 05月22日

Claude Code 技能堆疊：如何將 Superpowers、gstack 與 GSD 結合而不陷入混亂

本文旨在比較各種框架，找出它們的重疊之處，並最終確定一個穩定的三層實踐。

介紹

Claude Code 已迅速成為應用最廣泛的 AI 編碼工具之一。無論是個人開發者、新創公司還是大型工程團隊，都已將其整合到日常工作流程中——編寫生產程式碼、審查 pull request、除錯以及發布功能，其速度之快在一年前是難以想像的。隨著使用規模的擴大，其生態系統也隨之發展壯大。 Claude Skills——可組合的、自動呼叫的指令集，用於控制智能體的規劃、建構和驗證方式——已成為 Claude Code 最重要的擴展點之一。它們讓您能夠超越一次性提示，將可重複的工作流程直接編碼到智能體的行為中。事實上，Anthropic 公司已加倍投入這一方向：最新版本的 Claude Code將先前獨立的「斜杠命令」和「技能」系統整合為一個統一的技能格式，這表明技能現在已成為擴展智能體的標準方式。

技能如今已成為使用者體驗的核心，社群紛紛支持一些開源框架，這些框架將最佳實踐打包成現成的技能集。其中討論最多的兩個框架是Superpowers和gstack 。安裝這兩個框架聽起來很簡單；但實際上它們可能會衝突，而且在沒有規劃的情況下堆砌框架往往會降低系統的穩定性，而不是提高穩定性。那麼它們之間究竟有何差別呢？又該如何選擇呢？

這篇文章包含了三個內容：

從程式碼庫、功能和理念方面比較Superpowers 和 gstack——以下材料涉及明星、技能清單和權衡取捨。
加入許多指南忽略的第三層： GSD作為上下文/規範穩定器，以防止長期工作偏離（受 Tricia Notes Editorial 的三層框架啟發）。
最後制定一個統一的行動方案：誰負責決策、背景和執行，以及如何在不增加代幣使用或認知負荷的情況下挑選合適的技能。

真正有用的問題不僅是“超能力還是gstack？”，而是：你缺少的是什麼——決策能力、持久上下文還是執行力？

一句話概括： gstack 思考，GSD 穩定，Superpowers 執行。

方向：三層，而非兩層

實務上保持穩定的往往不是選擇某個框架而不是另一個框架，而是三方分工。

| 圖層 | 堆疊 | 角色 |

| -------------------- | --------------- | -------------------------------------------------------------------------------- |

|決策/角色| gstack | 從CEO、設計、架構、QA等角度進行判斷－不僅僅是「如何寫程式」。 |

|上下文/規範| GSD | 防止規範、狀態、邊界和長期上下文資訊過時。 |

|執行|超能力| 需求澄清 → 計畫 → 測試驅動開發 → 驗收，形成一個閉環。 |

各自的「優勢」體現在哪裡：

超能力－工作完成方式；流暢的執行循環。
gstack — 做什麼以及是否應該做；更豐富的角色為基礎的判斷。
GSD——不漂移；在長鏈上保持更穩定的規格和上下文。

Superpowers 和 gstack 都已風靡一時。表面上看，它們為人工智慧增添了流程；實際上，它們能幫助你清晰地思考真正重要的事情。當模型快速編碼時，正是你需要清晰的需求和穩定的脈絡的時候——而這正是大多數人仍然忽略的。

Superpowers 比較 gstack：簡單說明

Superpowers（GitHub 約 13.7 萬顆星）

儲存庫： obra/superpowers
代理技能架構和軟體開發方法：涵蓋腦力激盪、計畫、TDD、執行和驗證的 14 項內建技能。

gstack（GitHub 上約有 65K 個 star）

倉庫： garrytan/gstack
來自YC CEO Garry Tan ，開源。
理念：團隊伴你左右——CEO、設計師、工程經理、發布經理、文件工程師、品質保證人員等等——23 種有主見的工具（產品思維、CEO 評審、架構評審、真實瀏覽器測試、設計評審、安全審計等）。
Garry 聲稱在 60 天內編寫了 60 萬多行生產程式碼（其中 35% 為測試程式碼） ，而且他是在全職運營 YC 的同時兼職完成的。

星級評價只是一個不太可靠的指標：高星級並不代表每項技能都適合你的工作流程。

功能對比（Superpowers vs gstack）

| 類別 | 超能力 | gstack |

|----------------------------- |-------------------------------------------------------------------------------- |------------------------------------------------------------------------ |

|產品創意構思| 創意構思 | /辦公時間，/CEO計畫審核 |

|建築規劃| 規劃編寫 | /plan-eng-review, /autoplan |

|設計| — | /設計諮詢，/計畫設計審核，/設計速成，/設計HTML |

|開發執行| 執行計劃、子代理驅動開發、平行代理調度 | — |

|測試| 測試驅動開發 | /qa，/qa-only |

|除錯| 系統除錯 | /調查 |

|程式碼審查| 請求程式碼審查，接收程式碼審查 | /review，/codex |

|驗證與驗收| 完成前驗證，完成開發分會 | /ship，/land-and-deploy，/canary ，/document-release |

|安全| — | /cso、/careful、/freeze、/guard、/unfreeze |

|可觀測性| — | /learn, /retro |

|瀏覽器測試| — | /browse、/connect-chrome、/setup-browser-cookies |

| Git 工作樹| 使用 Git 工作樹 | — |

|技能管理| 使用超能力、寫作技能 | /gstack-upgrade |

|效能| — | /基準測試 |

|部署| — | /setup-deploy |

覆蓋範圍差異很大；數量不是重點－設計概念才是。

設計理念：「如何做」與「做什麼」（以及GSD的定位）

Superpowers－專注於程式碼的建構方式

工作流程的核心在於高品質產出：明確目標、制定計畫、測試驅動開發（ TDD ，即先測試後實現）、驗證。每個步驟都設有檢查點，幾乎沒有跳槽的餘地。實務中，這種流程嚴謹有序：你提出需求，系統就會產生相應的結果。對於那些已經明確目標的工程師來說，這個流程往往能讓他們更有掌控感。

（實際使用中的執行層面細節：流程嚴謹，執行穩定；即使是微小的任務，也會感覺很吃力，因為整個流程的節奏即使是很小的要求也適用。）

gstack－專注於做什麼和不做什麼。

在進行大量編碼之前，需要先確定諸如辦公時間步行需求之類的流程； CEO和工程師的評審會對該方法進行壓力測試。這不僅僅是程式碼測試——它還可以從用戶角度執行真實的瀏覽器測試。大致劃分如下：

決策層： /office-hours 、 /plan-ceo-review 、 /plan-eng-review
執行層： /review 、 /qa 、 /ship等。

當需求尚不清楚時，gstack 的優勢就顯現出來了——無論是產品經理、獨立開發者，還是「邊思考邊開發」的開發者。但要注意的是：啟用所有角色可能會顯得臃腫；決策技能也會消耗大量代幣（詳見下文）。

GSD——上下文/規範，而不是另一個“團隊圖表”

GSD不是「再組一個團隊」。它是情境工程：目標、規範、狀態、邊界和摘要都經過精心設計，減緩情境的腐敗。簡短的演示掩蓋了這一點；而長期專案則揭示了這一點——當情境搖擺不定時，輸出結果也會隨之分散；這才是狀態問題，而不僅僅是「執行不力」。

gstack本身可以思考，但它本身並不是一個長期的上下文庫。
Superpowers本身可以執行，但它本身並不是一個規範/上下文系統。
GSD填補了這一空白，使鏈保持連貫性。

三方比較（關注問題，而非「誰勝誰負」）

| 維度 | 超能力 | gstack | GSD |

|----------------- |----------------------------------------------------------------- |---------------------------------------------------------------- |---------------------------------------------------------------- |

|層| 執行 | 決策/角色 | 情境/規範 |

常見痛點詳解

強大的功能－前期投入過多的流程可能會讓人感覺很繁瑣。每個任務，無論大小，都要經歷完整的流程：明確需求、制定計畫、先寫測試、然後實現、最後驗證。對於大型功能來說，這種節奏確實能帶來豐厚的回報。但即使是兩行配置修改或快速的文字更改，同樣的流程也會啟動，最終導致你花在流程上的時間比實際修改的時間還要多。這種開銷並不會隨著任務規模的增加而減少，因此即使是小的請求也會感覺異常緩慢。

gstack－完全啟用後會變得臃腫且極度消耗代幣。每個 gstack 角色（CEO、設計師、架構師、QA 等）都會在上下文中註入其獨特的視角和提示。如果全部啟用，即使只是執行層的技能，在編寫任何實際程式碼之前，也可能消耗超過 1 萬個代幣。日常使用會迅速消耗代幣，多個「虛擬團隊成員」之間的來回溝通甚至會讓簡單的任務都顯得緩慢而重複。此外，在程式碼庫掃描過程中，你可能還會遇到一些無關的元問題（例如「你是否正在申請成為 YC 孵化的公司？」）——這些都是框架主觀角色層帶來的產物。

GSD－獨立使用時「交付」價值不高。 GSD的優點在於能夠長時間維持規範、目標和狀態的穩定。但如果單獨使用，它不會直接產生程式碼、執行測試或提交 PR。它是一個穩定器，而非建構器。如果沒有執行層（Superpowers）或決策層（gstack）的配合，GSD 管理的上下文就沒有任何實際作用——只是一些有用的基礎架構，沒有可見的輸出。只有當它與真正用於交付的工具結合使用時，其價值才能顯現出來。

實際意義：它們是互補的，而不是替代的——Superpowers 執行，gstack 決定，GSD 隨著時間的推移穩定規範和上下文。

優勢、劣勢和摩擦

超強國

優點：腦力激盪和整體工作流程感覺很紮實；即使是小的需求，一旦習慣了，整個流程也能變得順暢；執行力和測試驅動開發能力很強。
缺點：與 gstack 的決策層相比，Superpowers 的早期決策能力（例如計劃/腦力激盪）往往較弱——因此許多人將 gstack 的前端與 Superpowers 的執行相結合。

gstack

優點：決策層— /office-hours 、 /plan-ceo-review 、 /plan-eng-review因其定位和方法審查而脫穎而出。
缺點：與超級能力相比，執行起來感覺更粗糙；代幣成本是實實在在的——一個執行層技能可能需要 10000 多個代幣，而且大量的掃描感覺像是嘈雜的“過程”，而不是幫助。

類比

超能力就像一把手術刀——精準而有效率。

gstack是一家提供全方位服務的診所—從診斷到術後護理。

用比喻來選擇深度：狹義的執行與全方位的產品和審查。

綜合最佳實踐

1. 有意識地選擇技能－不要什麼都安裝。

技能數很容易螺旋式成長（今天學Superpower，明天學gstack，下週可能又學另一個堆疊）。有選擇地學習比盲目追求數量更重要；隨意呼叫既不穩定，又會徒增表面上的“技能數量”，而缺乏清晰度。

其核心概念：這兩個技術堆疊都是「優勢互補工程」的實驗。其想法是發揮優勢，彌補劣勢，而不是「我想要全部」。

2. 決策與執行（經典的劃分）－然後根據需要加入背景訊息

決策層的 gstack（精選）：

優先考慮高價值流程：例如/office-hours 、 /plan-ceo-review 、 /plan-eng-review ，用於需求和協調——避免在每個角色上投入過多資源。

執行層的超能力：

優先選擇 Superpowers 作為 TDD、計劃執行和驗證的基礎——如果 gstack 已經涵蓋了該階段，則可以選擇性地弱化其自身的繁重決策技能，這樣小任務就不會繼承雙重進程。

當鏈發散時，GSD：

如果工作跨越會話和線程，則加入GSD以使規範和狀態保持錨定——不是為了閃退，而是為了防止漂移。

3. 穩定的工作流程（三步驟）

決策 → gstack — 首先執行/office-hours來對想法進行壓力測試，然後執行/plan-ceo-review進行創始人級別的健全性檢查，最後執行/plan-eng-review來鎖定架構和資料流。如果設計很重要，則加入/plan-design-review 。目標：在編寫程式碼之前，決定要建置什麼以及是否要建置。
上下文 → GSD — 一旦做出決策，就使用 GSD (v2) 來指導計劃： PROJECT.md用於描述專案內容， DECISIONS.md用於架構選擇， KNOWLEDGE.md用於跨會話規則和模式，里程碑路線圖 ( M001-ROADMAP.md ) 用於分階段執行。這些 v2 文件可以保持規範、狀態和邊界的穩定，從而避免上下文在不同會話之間失效。（原始 GSD 使用的是REQUIREMENTS.md 、 ROADMAP.md和STATE.md 。）
執行 → Superpowers — 在明確需求和穩定上下文的基礎上，將專案移交給 Superpowers 的執行循環： brainstorming （如果仍需進行輕量級細化）、 writing-plans → executing-plans以實現、 test-driven-development用於 RED-GREEN-REFACTOR 循環）、 requesting-code-review / receiving-code-review以進行審查，以及verification-before-completion → finishing-a-development-branch前驗證→關閉。對於並行工作，請使用dispatching-parallel-agents或subagent-driven-development 。

合併後的標語： gstack 負責思考，Superpowers 負責執行，GSD 確保長篇上下文的準確性。將 gstack強大的決策能力與Superpowers 的執行力（必要時輔以 GSD）相結合，可以有效控制技能需求和衝突——這與作者利用周末時間，透過精心挑選的插件組合開發小型工具的經驗類似。