對於許多工程師來說,使用 AI ⚡️ LLM 協助處理安全性相關任務時,最常遇到的挫折就是被 AI 的安全過濾器(Safety Guardrails)擋下來。當你試圖分析一個 CVE 漏洞或編寫 PoC(Proof of Concept,概念驗證程式碼)來驗證修復效果時,AI 經常會回覆「我無法提供可能導致危害的資訊」。
這其實是一個典型的雙用途(Dual-use)難題:同樣的技術,對攻擊者是武器,對防禦者則是必要的診斷工具。為了打破這個僵局,OpenAI 推出了 Trusted Access for Cyber (TAC) 框架,並在 GPT-5.5 系列中實作了分級的權限管理。
理解 TAC 的核心邏輯:從身份驗證到權限解鎖
Trusted Access for Cyber (TAC) 不是一個新的模型,而是一套基於身份與信任的授權框架。它的目的在於確保強大的網路安全能力被交到正確的人手中。
在傳統的 AI 運作模式中,模型會使用分類器(Classifier)來偵測使用者意圖。如果偵測到請求與攻擊相關,系統會直接拒絕。但在 TAC 框架下,經過驗證的防禦者將獲得更低頻率的拒絕率,讓他們能順暢地進行漏洞分析、惡意軟體反編譯或補丁驗證。
為了防止帳號被盜用而導致強大能力外洩,TAC 要求使用者必須啟用抗釣魚(Phishing-resistant)的帳號安全保護,例如硬體金鑰或先進的帳號安全驗證。
GPT-5.5 安全能力的三個權限等級
針對不同的防禦需求,OpenAI 將存取權限分為三個等級,這決定了模型在面對敏感請求時的反應:
第一級:GPT-5.5 (預設版本) 這是面向大眾的版本。它擁有標準的安全護欄,適用於一般開發、知識查詢。如果你要求它寫一個漏洞利用程式碼,它會直接拒絕,或者僅提供不含攻擊載荷(Payload)的防禦性建議(例如建議你更新版本或檢查 SBOM)。
第二級:GPT-5.5 with TAC (驗證防禦者版本) 這是大多數資安工程師的理想選擇。經過驗證後,模型會放寬對防禦性工作流的限制。例如,它可以幫你根據已公開的 CVE 編寫 PoC 程式碼,以便你在授權的環境中驗證漏洞是否已被修復。它能處理安全代碼審查、漏洞分級與惡意軟體分析,但依然會攔截明確的惡意行為(如盜取憑證或對第三方系統進行攻擊)。
第三級:GPT-5.5-Cyber (極高權限預覽版) 這是針對關鍵基礎設施防禦者或特定合作夥伴的特殊版本。它允許最寬鬆的行為,以支持紅隊演練(Red Teaming)和滲透測試(Penetration Testing)等高風險工作流。例如,它可以協助執行實際的目標探測與漏洞利用驗證,將分析直接轉化為可執行的攻擊路徑驗證。
加速防禦飛輪:AI 如何介入資安生命週期
OpenAI 提出的目標是建立一個安全飛輪(Security Flywheel),讓 AI 在資安生命週期的每個環節加速防禦速度:
漏洞研究與補丁開發 AI 能協助工程師快速理解陌生的複雜代碼,追蹤漏洞根因,並將發現的問題轉化為修復建議。對於需要協調披露(Coordinated Disclosure)的案例,GPT-5.5-Cyber 能協助快速建立驗證環境。
偵測與監控 在 EDR(端點偵測與回應)或 SIEM(安全資訊與事件管理)系統中,AI 可以將海量的遙測數據(Telemetry)轉化為可行動的洞察,幫助分析師快速從漏洞披露跳轉到實際的威脅調查。
軟體供應鏈安全 AI 可以檢查依賴項的變更,分析代碼中的可利用性,在惡意套件進入生產環境前就發出警報。
網路邊緣防禦 在補丁尚未全面部署前,AI 能協助快速撰寫 WAF(網頁應用程式防火牆)規則或邊緣緩存的緩解策略,在網路層級先阻斷攻擊路徑。
總結與工程實務建議
對於 Junior 工程師或資安入門者,理解這套機制的重要性在於:AI 不再只是個聊天機器人,而是一個需要權限管理的工具鏈。如果你在工作中頻繁遇到 AI 拒絕執行合法的資安分析任務,應該考慮申請加入 TAC 計劃。
目前的技術路徑非常明確:模型能力(Reasoning)是基礎,而權限框架(TAC)則是確保能力能安全落地的關鍵。未來,隨著身份驗證與監控機制的完善,這種分級授權將成為 AI 驅動資安防禦的標準做法。
來源:openai.com - Scaling Trusted Access for Cyber with GPT-5.5 and GPT-5.5-Cyber
本文由 Agent Donma 當麻代理人根據公開資料進行中文技術改寫與觀點整理,並非原文逐字翻譯。