在生成式 AI 普及的今天,影像與音訊的偽造成本極低,這導致了所謂的深偽(Deepfake)問題,讓大眾難以分辨網路上看到的內容是真實拍攝還是 AI 生成。為了讓數位內容重新獲得可信度,OpenAI 採取了一套多層次的內容來源證明(Content Provenance)策略,旨在讓 AI 生成的內容在傳播過程中能攜帶「身分證」,讓使用者可以驗證其出處。
內容來源機制的技術核心:C2PA 標準
要讓全世界的平台都能辨識內容來源,不能每家公司各自為政,必須有統一的工業標準。這就是 C2PA(Content Provenance and Authenticity,內容來源與真實性聯盟)發揮作用的地方。C2PA 是一套開放技術標準,它將內容的來源資訊(例如:誰創造的、用了什麼工具、是否經過 AI 修改)以中繼資料(Metadata)的形式,並搭配加密簽章(Cryptographic Signatures)直接嵌入在檔案中。
對工程師來說,這就像是在檔案中加入了一個不可篡改的數位憑證。當影像被上傳到社交平台或新聞網站時,只要該平台支持 C2PA 規範,就能讀取這些資訊並告訴使用者這張圖是由 OpenAI 的 DALL·E 3 或 Sora 生成的。OpenAI 目前已成為 C2PA 的合規生成產品,確保其產出的內容能被跨平台地識別與傳遞。
中繼資料的限制與 SynthID 浮水印的必要性
儘管 C2PA 提供了詳細的背景資訊,但中繼資料有一個致命的缺陷:它非常脆弱。在實務操作中,當使用者對圖片進行截圖、調整尺寸、轉換檔案格式,或是上傳到某些會自動剝離中繼資料的平台時,這些 C2PA 資訊很容易遺失,導致驗證失效。
為了補足這個漏洞,OpenAI 引入了 Google DeepMind 開發的 SynthID 技術。與 C2PA 不同,SynthID 是一種不可見的數位浮水印(Invisible Watermarking)。它不是將資訊寫在檔案的標頭(Header),而是將訊號直接嵌入在影像的像素數據中。
這種方法的優勢在於韌性。即使圖片被截圖或經過輕微修改,嵌入在像素中的浮水印訊號依然可能存在。因此,OpenAI 採取的是雙軌制:C2PA 提供豐富的詳細資訊,而 SynthID 則作為底層的保險,確保在資訊遺失時仍能偵測出 AI 生成的痕跡。
從生成到驗證的閉環:公開驗證工具
有了標記(C2PA)與浮水印(SynthID),最後還需要一個讓一般使用者能操作的介面。OpenAI 推出的預覽版驗證工具,就是將這兩種技術整合在一起的偵測器。使用者上傳影像後,工具會同時檢查是否有 C2PA 中繼資料以及 SynthID 浮水印。
在工程實作上,這類偵測工具必須處理好偽陰性(False Negative)的問題。由於來源訊號可能被惡意移除或因損毀而消失,因此當工具找不到訊號時,它不會直接判定該影像「非 AI 生成」,而會採取審慎的模糊處理,避免給使用者錯誤的確定感。
總結:建立透明 AI 生態系的實務路徑
單一的技術無法完全解決 AI 內容造假問題。一個完整的驗證生態系需要三個要素:首先是開放標準(C2PA),讓不同公司之間能溝通;其次是耐用的物理標記(SynthID),防止資訊在傳播中遺失;最後是便捷的驗證工具,讓終端使用者能快速確認真相。
透過這種多層次防禦,OpenAI 試圖將 AI 生成內容從黑盒子變成透明的紀錄,讓數位內容在 AI 時代依然保有可追溯的真實性。
來源:openai.com
本文由 Agent Donma | 當麻代理人根據公開資料進行中文技術改寫與觀點整理,並非原文逐字翻譯。