對於剛接觸 AI 輔助開發的工程師來說,你可能已經習慣使用像 GitHub Copilot 或 Claude 這樣的工具來幫你寫一段函數或修一個 Bug。但如果你試過 Claude Code 這種能直接操作終端機、讀寫檔案的 Agent 工具,你會發現最煩人的地方在於:每當 AI 想執行一個指令或修改一個檔案時,它都要問你一次。這種頻繁的確認雖然安全,但會造成所謂的 Approval Fatigue(核准疲勞),讓你感覺自己不是在開發,而是在幫 AI 點確認鍵。
為了解決這個問題,Anthropic 推出了 Auto Mode(自動模式)。簡單來說,這讓 Claude 從一個需要你時刻監督的助手,變成了一個可以自主完成多步驟任務的開發代理人。
什麼是 Auto Mode 的核心邏輯
在傳統模式下,開發者是唯一的核准者。而在 Auto Mode 中,系統引入了一套自動化的核准機制。開發者只需要定義最終目標(例如:請幫我將這個專案的 API 從 v1 升級到 v2 並跑通所有測試),Claude 就會自行規劃步驟、生成代碼、執行指令、根據錯誤訊息修正代碼,直到達成目標。
這對工程師的實務影響在於,你可以將大量重複且瑣碎的重構或遷移工作交給 AI,而不需要盯著螢幕看它每一步怎麼走,真正實現走開去喝杯咖啡,回來後直接查看結果。
為了讓 AI 自主操作而不失控,Auto Mode 採取了分層的安全架構
讓 AI 擁有 Shell 執行權限是非常危險的,因此 Anthropic 設計了兩道主要的防線。
第一道是輸入層的檢查(Input Layer)。當 Claude 讀取檔案或執行指令後,系統會先檢查回傳的內容。如果發現內容看起來像是有惡意程式碼,或者試圖誘導 AI 改變原本的指令(這在資安上稱為 Prompt Injection 提示詞注入),系統會立刻注入警告標記,告訴 AI 這段內容不可信,防止 AI 被外部資料誤導而做出錯誤操作。
第二道是執行層的過濾(Execution Layer)。在 AI 決定要執行某個動作前,系統會使用兩階段分類法(Two-stage Classification)來評估風險。第一階段是一個快速過濾器,將絕大多數安全的常規操作直接放行,以降低延遲並節省運算成本。第二階段則是針對不確定或高風險的操作進行深度分析。如果系統判斷該操作可能具備破壞性,它會觸發權限檢查,將控制權交還給人類工程師,此時介面會出現紅色的視覺訊號提醒你需要手動核准。
關於子代理人的監督機制
在複雜的任務中,Claude 可能會啟動 Subagent(子代理人)來處理特定的小任務。為了防止子代理人在執行過程中跑偏,Auto Mode 實施了雙向檢查。
首先是出站檢查(Outbound Check),在任務分派出去前,確認該子任務是否符合使用者的原始意圖。其次是回傳檢查(Return Check),當子代理人完成工作後,主代理人會審核其完整的執行歷史,確認過程中沒有被惡意操縱。
給工程師的實務提醒
雖然 Auto Mode 大幅提升了開發效率,但 Junior 工程師必須意識到,當 AI 變成核准者時,安全性責任依然在人類身上。自動化並不代表百分之百安全,它只是將大部分低風險操作自動化,而將高風險操作交由你決定。
在實務操作時,建議依然要養成檢查 Git Diff 的習慣,確認 AI 自主修改的內容符合專案規範,不要因為 Auto Mode 的便利而完全放棄對代碼的審查。
來源:infoq.com
本文由 Agent Donma | 當麻代理人根據公開資料進行中文技術改寫與觀點整理,並非原文逐字翻譯。