gstack

gstack：將 AI 編碼助手轉化為虛擬工程團隊的工作流框架

2026/05/14 github.com

gstack 是由 YC 總裁 Garry Tan 開源的 AI 工作流框架，旨在解決 AI 編碼缺乏架構思考的問題。它透過定義多個專業角色（如 CEO、Staff Engineer）建立強制性審核流程，並整合持久化瀏覽器與記憶體系統以提升驗證能力。該工具適合追求高效能、低垃圾代碼產出的獨立開發者。

gstack 是由 Y Combinator 總裁 Garry Tan 開源的一套 AI 工程工作流框架。簡單來說，它不是一個新的 AI 模型，而是一組給 Claude Code（以及其他 AI Agent）使用的「技能包」。

很多工程師在使用 AI 編碼時會遇到一個問題：AI 往往太快進入寫程式階段，導致產出的程式碼雖然能跑，但缺乏架構思考、忽略邊界案例，或者直接寫出不符合產品直覺的功能。gstack 解決這個問題的核心做法是「角色化」與「流程化」。

核心做法：將 AI 轉化為虛擬團隊

gstack 透過定義一系列的 SKILL.md 檔案，為 AI 注入特定的專業人格與審核標準。它將開發過程拆解為多個階段，每個階段由不同的虛擬角色把關：

產品思考階段：透過 /office-hours 角色，AI 不會直接寫 code，而是先像 YC 導師一樣挑戰你的產品假設，強迫你定義真正的痛點。

規劃審核階段：提供 /plan-ceo-review（審核產品價值）、/plan-eng-review（鎖定架構與數據流）、/plan-design-review（審核 UI/UX 質量）。

實作與驗證階段：包含 /review（Staff Engineer 級別的 Bug 找尋）、/qa（啟動真實瀏覽器進行端到端測試）、/cso（首席安全官進行安全審計）。

發布階段：使用 /ship 與 /land-and-deploy 自動處理測試、提交 PR 與部署驗證。

技術亮點：持久化瀏覽器與記憶體

gstack 最強大的技術實作在於其瀏覽器驅動能力。它運行一個基於 Bun 的 Chromium 守護進程（Daemon），讓 AI Agent 擁有一個具備持久化狀態（Cookies、分頁）且低延遲（100-200ms）的真實瀏覽器。這使得 AI 能真正地「看到」頁面、操作 UI 並驗證 Bug，而不是僅僅依賴 HTML 文本。

此外，它整合了 GBrain 記憶體系統，讓 AI 能在不同 Session 之間記住專案的決策紀錄、失敗經驗與偏好，解決了 AI Agent 每次對話都像個新人的問題。

適合誰使用

這個工具非常適合獨立開發者（Solopreneurs）或技術創辦人。如果你希望一個人發揮一個工程團隊的產能，且不希望在 AI 產出大量垃圾代碼（AI Slop）後才發現方向錯了，gstack 提供的強制性審核流程能幫你把關。

導入成本與風險

導入成本較低，只要安裝了 Claude Code 並執行簡單的安裝腳本即可。但實務上存在以下風險：

依賴性強：高度依賴 Claude Code 或特定的 AI Agent 環境，若切換到不支持斜線指令的工具，其價值會大幅下降。

Token 消耗：由於 gstack 強制執行多輪審核（CEO $\rightarrow$ Eng $\rightarrow$ Design），單次功能的開發會消耗比直接 prompt 更多的 Token。

權限風險：其瀏覽器功能涉及 Cookie 導入與 CDP 協議操作，在處理敏感帳戶時需謹慎。

成熟度判斷

gstack 目前處於高度實戰的早期階段。它不是一個精雕細琢的商業產品，而是一個「實踐者」將自己的高效工作流直接開源。代碼結構清晰，且針對 Windows/Mac 做了兼容處理，但其核心價值在於那套「工程方法論」而非複雜的算法。

總結來說，gstack 將 AI 編碼從「對話式生成」提升到了「流程化管理」，讓 AI 不再只是個寫程式的助手，而是一個可以被管理、有審核機制的虛擬團隊。

AI觀點

gstack 並非底層技術的突破，而是一套將軟體工程管理方法論「指令化」的工程折衷方案，其核心價值在於透過角色定義強制 AI 延遲生成行為，以解決 AI Agent 過早進入實作而導致的架構崩潰問題。引入持久化瀏覽器與記憶體系統顯著提升了端到端驗證的成熟度，使其能從單純的代碼生成轉向具備閉環能力的自動化交付。然而，該框架高度依賴特定 Agent 環境（如 Claude Code），且多階段審核機制將導致 Token 成本線性增加，對於追求快速原型開發的小規模專案而言可能過於沉重。整體而言，這是一個針對獨立開發者的實戰過渡方案，將 AI 編碼從「隨機生成」推向「流程管控」，值得關注其如何定義 AI 時代的標準開發工作流，但在企業級權限管理與成本控制上仍有明顯限制。