AI 創作內容 (AIGC) 技術突飛猛進,人類已經越來越難辨識眼前所見照片、影片的真實度。為了讓使用者可以區別哪些是由 AI 產生的「非真實內容」,進而信任圖片的真實性,如:微軟、Adobe、Google、Midjourney、Nikon…等 AI 技術大廠紛紛建立起 AI 內容識別技術,幫助使用者辨認圖片真實性,也進一步保護創作者的著作權。
本文手哥就帶大家來看看有那些 AI 內容識別技術。
Deepfake、聲音複製、合成音樂、AI 畫圖…這些技術在最近 2 年內發展成熟,如今光靠人眼已經難以辨識什麼是正確、真實的--即便是一位訓練有素的專家--許多假新聞、假圖片也造成許多亂象。例如去年這張天主教宗方濟各穿著白色羽絨外套的照片,就是使用 AI 繪圖平台 Midjourney 畫的。
另外還有這張川普被捕照片,也同樣是 AI 繪製的假照片。
在去年,這些照片都還留有一些破綻 (即便整體看起來很真實),但現在這些破綻都已經被改善很多。
也因為這樣,AI 技術大廠、影像產業的公司便開始聯合建立標準,透過數位浮水印技術,在 AI 產生的圖片中埋入一些人眼不可見的資訊,只要透過特殊工具就可以得知他是如何製作?是人工智慧生成的?什麼時候建立的?什麼時候編輯的…等等資訊。
這項技術是由 Google DeepMind 開發,SynthID 是一個用於產生浮水印和識別人工智慧生成內容的工具。它可以把數位浮水印嵌入到使用者產生的人工智慧生成影像或音訊中。這個水印對人類是不可察覺的,但可以用於識別。
SynthID 系統使用兩個深度學習模型:
SynthID 不只可以用於影像,也可以將數位浮水印嵌入到音訊中,SynthID 會先將聲音波型轉為頻譜圖,數位浮水印加到其中,最後再將頻譜圖轉回波型。Google 製作了一段影片,你可以聽看看加上浮水印的聲音有沒有差別?
C2PA全名為「內容來源和真實性聯盟 (Coalition for Content Provenance and Authenticity)」。C2PA 聯盟由 Adobe 發起,目前加入的會員也都是世界級的影像服務、設備廠商,如:Nikon、ARM、Intel、Microsoft、Leica 等。
這個聯盟制定了一個名為「內容憑證 (Content cRedentials, CR)」的數位內容標記,這是一個開放性標準,任何廠商、軟體開發者都可以遵循標準來在產生的圖片、文件或影片中嵌入憑證資訊。目前使用微軟 DALL-E 和 Adobe Firefly 建立的 AI 圖片都會嵌入 CR 憑證。
任何支援 CR 憑證識別的網站只要發現圖片中有憑證資訊,就會在圖片右上方顯示「cr」圖示,點開就可以檢視圖片的相關資訊,若是由 AI 工具產生的照片,也會在這邊看到明確的標記。
除此之外,CR 憑證也可以紀錄圖片的編輯歷史,讓你可以找到每一張圖片的詳細變化歷史紀錄。
使用者可以透過 C2PA 提供的驗證網站來取得圖片的內容憑證資訊,也可以使用這個工具確認別人交付給你的檔案是不是真實、非 AI 產生的圖片。
不過並不是所有的 AI 廠商都有一樣的想法,Midjourney 和 Stability AI、Shutterstock 這幾家公司都宣布採用一個更古老,但支援性相對更高的 IPTC 中繼資料 (metadata) 來標記 AI 產生的內容。
IPTC 已經在影像業界已經成為其中的廣泛使用標準,如 Photoshop 等圖片編輯軟體也都可以直接編輯 IPTC 資訊。另外,Google 在 2023 年的 Google I/O 上也已經說明,未來在 Google 圖片搜尋結果中,將會參考 IPTC 的資訊來標記圖片。
不過截至目前為止,Midjourney 和 Shutterstock 都尚未將 IPTC 中繼資料加入 AI 產生的檔案中。
歡迎到《硬是要學》AI 專欄,瀏覽更多 AI 科技發展趨勢文章