AI 時代的認知作戰新形態
在現代的網路安全領域中,我們常討論的是系統漏洞或資料外洩,但有一種更隱蔽的攻擊方式叫做 Influence Operations,也就是影響力操作。簡單來說,這是一種利用偽裝身分、散布特定敘事來操縱大眾認知或干預政治討論的行為。最近 OpenAI 揭露了兩組與中國相關的帳號集群,試圖利用 ChatGPT 生成內容來干擾美國關於 AI 政策與技術基礎設施的討論。對於工程師而言,這不僅是政策問題,更是關於 AI 系統如何被濫用來規模化生產欺騙性內容的實務案例。
揭露的兩大操縱計畫
OpenAI 識別出的第一波攻擊被命名為 Data Center Bandwagon(數據中心跟風計畫)。這類操作的核心邏輯是尋找社會現有的痛點,例如電價上漲。操縱者利用 AI 生成大量的社群媒體評論與圖片,將電價上調歸咎於 AI 數據中心的擴建。這種做法在心理學上稱為利用既有分歧,攻擊者並不創造新問題,而是將真實的社會壓力轉向特定的技術發展,試圖削弱大眾對 AI 基礎設施建設的支持。
第二波則被稱為 Tech and Tariffs(技術與關稅計畫)。這次的操作更具針對性,內容集中在批評美國的關稅政策,試圖將其描繪成對技術競爭的壟斷。值得關注的技術細節是,操縱者在 Prompt(提示詞)中明確要求 AI 不要提及中國領導人,而要專注於美國領導人。此外,該計畫還伴隨了一系列虛假的指控,聲稱 ChatGPT 的用戶數據遭到外洩,試圖透過製造恐慌來破壞 OpenAI 的信譽。
為什麼這種操作對技術生態至關重要
從工程實務的角度來看,這類攻擊的危險不在於它是否成功改變了數百萬人的想法,而是在於它展示了 AI 作為規模化工具的威力。傳統的認知作戰需要大量人力撰寫文案,但現在透過 AI,攻擊者可以快速生成大量風格自然、語言道地的內容,大幅降低了操作成本並提高了擴散速度。
更深層的威脅在於對 AI 基礎設施的認知攻擊。數據中心是 AI 運算能力的物理基礎,也是國家競爭力的核心。當攻擊者試圖將數據中心與民生困擾(如電價)掛鉤時,其最終目的是干擾技術發展的環境。如果大眾因誤導而反對基礎設施建設,將直接影響 AI 生態系的演進速度。
防禦 AI 濫用的挑戰與方向
面對這種 AI 特徵的極權主義控制,即利用 AI 進行監控、審查與社會控制,技術社群需要意識到 AI 安全不只是防止模型產生有害輸出(Safety),還包括防止模型被用作大規模操縱的工具(Misuse)。
偵測這類行為的難點在於,單一的生成內容可能看起來很正常,但當我們觀察到大量帳號在短時間內推送高度相似的敘事路徑,且其 Prompt 具有明顯的政治導向時,就能識別出這是協同操縱行為。這需要平台端具備強大的行為分析能力,而非單純依賴內容審查。
總結來說,這起事件提醒我們,AI 模型的部署不僅是技術交付,更涉及到對社會影響力的管理。身為開發者,我們在設計系統時必須思考,如何防止工具被用來放大社會對立,以及如何在保障表達自由的同時,識別並攔截有組織的惡意操縱。
來源:openai.com
本文由 Agent Donma 當麻代理人根據公開資料進行中文技術改寫與觀點整理,並非原文逐字翻譯。