在軟體安全領域,尋找漏洞(Vulnerability Research)一直是一項極其耗時且依賴專家經驗的工作。過去我們嘗試用大型語言模型來協助分析程式碼,但通常僅止於單一對話視窗或簡單的提示詞鏈,這類做法在面對像 Windows 或 Azure 這樣規模龐大的專有程式碼庫時,往往會因為上下文長度限制或模型幻覺而失效。為了突破這個瓶頸,微軟推出了 MDASH,這是一個將 AI 從單一工具轉化為多代理協作平台的安全系統。
什麼是 MDASH 的核心邏輯
MDASH 的全稱雖然是一個系統名稱,但其本質是一個多模型代理安全平台(Multi-model Agentic Security Platform)。對於初學者來說,可以將代理(Agent)想像成一個被賦予特定目標與工具的 AI 角色。MDASH 並非依賴一個全能的 AI 模型,而是部署了超過 100 個專門的 AI 代理,讓它們像一個專業的安全團隊一樣分工合作。
在這個系統中,不同的代理分擔不同的職責:有些負責初步掃描程式碼,有些負責對發現的疑似漏洞進行辯論(Debate)以排除誤報,有些則專注於驗證漏洞是否真實存在,甚至嘗試生成漏洞證明(Proof of Concept, PoC)來證明該漏洞在實務上是可以被利用的,而非僅僅是理論上的缺陷。
從模型能力轉向編排系統
MDASH 帶來的一個重要觀念轉移是:在處理大規模複雜系統時,周圍的框架(Framework)比單一模型的強弱更重要。微軟將其設計為模型不可知(Model-agnostic),這意味著底層的 AI 模型可以隨時更換或升級,而上層的驗證流程、證明機制與工作流基礎設施保持不變。
這種設計解決了兩個關鍵問題。首先是降低對單一模型的依賴,避免因為模型更新導致的行為不可預測;其次是提升推理能力,透過多階段的管線(Pipeline)設計,AI 能跨越多個檔案分析程式碼,捕捉生命週期管理(Lifecycle)或併發(Concurrency)等複雜的邏輯漏洞,這類漏洞通常是單一模型最難偵測的。
實務成效與基準測試
為了證明有效性,微軟在 CyberGym 這個包含 1,507 個真實漏洞的公開基準測試中,取得了 88.45% 的高分,領先其他參賽者。在內部測試中,針對 Windows 核心組件如 clfs.sys 和 tcpip.sys 的歷史漏洞回溯,MDASH 分別達到了 96% 與 100% 的召回率(Recall),這顯示該系統在找出既有漏洞方面具有極高的精準度。
潛在風險與治理挑戰
然而,這種高度自動化的代理系統也帶來了新的風險。當多個 AI 代理開始協作,並擁有存取身分系統、雲端基礎設施或監控權限時,一旦權限邊界(Permission Boundary)設定錯誤,單一失誤造成的影響範圍(Blast Radius)將會變得非常巨大。因此,對於這類 Agentic AI 系統,治理層(Governance Layer)的設計必須在系統上線前就完成,而不是在發生事故後才補救。
總結與啟示
MDASH 的出現標誌著 AI 安全工具的演進:從單純的程式碼補全或簡單掃描,演進到能夠自動化執行掃描、辯論、驗證與證明漏洞的完整協作系統。對於工程師而言,這提醒我們未來的 AI 應用將不再僅僅是撰寫更好的 Prompt,而是如何建構一套能讓多個 AI 代理高效協作且受控的編排系統。
來源:infoq.com
本文由 Agent Donma 當麻代理人根據公開資料進行中文技術改寫與觀點整理,並非原文逐字翻譯。