gstack 是由 Y Combinator 總裁 Garry Tan 開源的一套 AI 工程工作流框架。簡單來說,它不是一個新的 AI 模型,而是一組給 Claude Code(以及其他 AI Agent)使用的「技能包」。
很多工程師在使用 AI 編碼時會遇到一個問題:AI 往往太快進入寫程式階段,導致產出的程式碼雖然能跑,但缺乏架構思考、忽略邊界案例,或者直接寫出不符合產品直覺的功能。gstack 解決這個問題的核心做法是「角色化」與「流程化」。
核心做法:將 AI 轉化為虛擬團隊
gstack 透過定義一系列的 SKILL.md 檔案,為 AI 注入特定的專業人格與審核標準。它將開發過程拆解為多個階段,每個階段由不同的虛擬角色把關:
產品思考階段:透過 /office-hours 角色,AI 不會直接寫 code,而是先像 YC 導師一樣挑戰你的產品假設,強迫你定義真正的痛點。
規劃審核階段:提供 /plan-ceo-review(審核產品價值)、/plan-eng-review(鎖定架構與數據流)、/plan-design-review(審核 UI/UX 質量)。
實作與驗證階段:包含 /review(Staff Engineer 級別的 Bug 找尋)、/qa(啟動真實瀏覽器進行端到端測試)、/cso(首席安全官進行安全審計)。
發布階段:使用 /ship 與 /land-and-deploy 自動處理測試、提交 PR 與部署驗證。
技術亮點:持久化瀏覽器與記憶體
gstack 最強大的技術實作在於其瀏覽器驅動能力。它運行一個基於 Bun 的 Chromium 守護進程(Daemon),讓 AI Agent 擁有一個具備持久化狀態(Cookies、分頁)且低延遲(100-200ms)的真實瀏覽器。這使得 AI 能真正地「看到」頁面、操作 UI 並驗證 Bug,而不是僅僅依賴 HTML 文本。
此外,它整合了 GBrain 記憶體系統,讓 AI 能在不同 Session 之間記住專案的決策紀錄、失敗經驗與偏好,解決了 AI Agent 每次對話都像個新人的問題。
適合誰使用
這個工具非常適合獨立開發者(Solopreneurs)或技術創辦人。如果你希望一個人發揮一個工程團隊的產能,且不希望在 AI 產出大量垃圾代碼(AI Slop)後才發現方向錯了,gstack 提供的強制性審核流程能幫你把關。
導入成本與風險
導入成本較低,只要安裝了 Claude Code 並執行簡單的安裝腳本即可。但實務上存在以下風險:
依賴性強:高度依賴 Claude Code 或特定的 AI Agent 環境,若切換到不支持斜線指令的工具,其價值會大幅下降。
Token 消耗:由於 gstack 強制執行多輪審核(CEO $\rightarrow$ Eng $\rightarrow$ Design),單次功能的開發會消耗比直接 prompt 更多的 Token。
權限風險:其瀏覽器功能涉及 Cookie 導入與 CDP 協議操作,在處理敏感帳戶時需謹慎。
成熟度判斷
gstack 目前處於高度實戰的早期階段。它不是一個精雕細琢的商業產品,而是一個「實踐者」將自己的高效工作流直接開源。代碼結構清晰,且針對 Windows/Mac 做了兼容處理,但其核心價值在於那套「工程方法論」而非複雜的算法。
總結來說,gstack 將 AI 編碼從「對話式生成」提升到了「流程化管理」,讓 AI 不再只是個寫程式的助手,而是一個可以被管理、有審核機制的虛擬團隊。
AI觀點
gstack 並非底層技術的突破,而是一套將軟體工程管理方法論「指令化」的工程折衷方案,其核心價值在於透過角色定義強制 AI 延遲生成行為,以解決 AI Agent 過早進入實作而導致的架構崩潰問題。引入持久化瀏覽器與記憶體系統顯著提升了端到端驗證的成熟度,使其能從單純的代碼生成轉向具備閉環能力的自動化交付。然而,該框架高度依賴特定 Agent 環境(如 Claude Code),且多階段審核機制將導致 Token 成本線性增加,對於追求快速原型開發的小規模專案而言可能過於沉重。整體而言,這是一個針對獨立開發者的實戰過渡方案,將 AI 編碼從「隨機生成」推向「流程管控」,值得關注其如何定義 AI 時代的標準開發工作流,但在企業級權限管理與成本控制上仍有明顯限制。