AI生成圖片氾濫,怎麼識別 AI 產生的圖片?3 大 AI 內容識別技術

更新於 發佈於 閱讀時間約 5 分鐘

AI 創作內容 (AIGC) 技術突飛猛進,人類已經越來越難辨識眼前所見照片、影片的真實度。為了讓使用者可以區別哪些是由 AI 產生的「非真實內容」,進而信任圖片的真實性,如:微軟、Adobe、Google、Midjourney、Nikon…等 AI 技術大廠紛紛建立起 AI 內容識別技術,幫助使用者辨認圖片真實性,也進一步保護創作者的著作權。

本文手哥就帶大家來看看有那些 AI 內容識別技術

為什麼需要「AI 內容識別技術」?

Deepfake、聲音複製、合成音樂、AI 畫圖…這些技術在最近 2 年內發展成熟,如今光靠人眼已經難以辨識什麼是正確、真實的--即便是一位訓練有素的專家--許多假新聞、假圖片也造成許多亂象。例如去年這張天主教宗方濟各穿著白色羽絨外套的照片,就是使用 AI 繪圖平台 Midjourney 畫的。

AI生成圖片氾濫,怎麼識別 AI 產生的圖片?3 大 AI 內容識別技術

AI生成圖片氾濫,怎麼識別 AI 產生的圖片?3 大 AI 內容識別技術

另外還有這張川普被捕照片,也同樣是 AI 繪製的假照片。

AI生成圖片氾濫,怎麼識別 AI 產生的圖片?3 大 AI 內容識別技術

AI生成圖片氾濫,怎麼識別 AI 產生的圖片?3 大 AI 內容識別技術

在去年,這些照片都還留有一些破綻 (即便整體看起來很真實),但現在這些破綻都已經被改善很多。

也因為這樣,AI 技術大廠、影像產業的公司便開始聯合建立標準,透過數位浮水印技術,在 AI 產生的圖片中埋入一些人眼不可見的資訊,只要透過特殊工具就可以得知他是如何製作?是人工智慧生成的?什麼時候建立的?什麼時候編輯的…等等資訊。

目前有哪些「AI 內容識別技術」?

1. Google 推自家 SynthID 技術

AI生成圖片氾濫,怎麼識別 AI 產生的圖片?3 大 AI 內容識別技術 image-22

AI生成圖片氾濫,怎麼識別 AI 產生的圖片?3 大 AI 內容識別技術 image-22

這項技術是由 Google DeepMind 開發,SynthID 是一個用於產生浮水印和識別人工智慧生成內容的工具。它可以把數位浮水印嵌入到使用者產生的人工智慧生成影像或音訊中。這個水印對人類是不可察覺的,但可以用於識別。

SynthID 系統使用兩個深度學習模型:

  • 浮水印產生模型:使用嵌入式浮水印技術,將數位浮水印直接添加到 AI 生成的內容中。組合模型經過最佳化,透過將浮水印與原始內容對齊來提高不可察覺性。
  • 識別模型:SynthID 可以掃描影像或音訊中的數位浮水印,並幫助使用者評估內容或內容的一部分是否是使用 Google 的 AI 模型產生的。

SynthID 不只可以用於影像,也可以將數位浮水印嵌入到音訊中,SynthID 會先將聲音波型轉為頻譜圖,數位浮水印加到其中,最後再將頻譜圖轉回波型。Google 製作了一段影片,你可以聽看看加上浮水印的聲音有沒有差別?


2. 最多大廠加入 C2PA 聯盟 (Content Credential 憑證)

C2PA全名為「內容來源和真實性聯盟 (Coalition for Content Provenance and Authenticity)」。C2PA 聯盟由 Adobe 發起,目前加入的會員也都是世界級的影像服務、設備廠商,如:Nikon、ARM、Intel、Microsoft、Leica 等。

這個聯盟制定了一個名為「內容憑證 (Content cRedentials, CR)」的數位內容標記,這是一個開放性標準,任何廠商、軟體開發者都可以遵循標準來在產生的圖片、文件或影片中嵌入憑證資訊。目前使用微軟 DALL-E 和 Adobe Firefly 建立的 AI 圖片都會嵌入 CR 憑證。

任何支援 CR 憑證識別的網站只要發現圖片中有憑證資訊,就會在圖片右上方顯示「cr」圖示,點開就可以檢視圖片的相關資訊,若是由 AI 工具產生的照片,也會在這邊看到明確的標記。

AI生成圖片氾濫,怎麼識別 AI 產生的圖片?3 大 AI 內容識別技術 image-24

AI生成圖片氾濫,怎麼識別 AI 產生的圖片?3 大 AI 內容識別技術 image-24

除此之外,CR 憑證也可以紀錄圖片的編輯歷史,讓你可以找到每一張圖片的詳細變化歷史紀錄。

AI生成圖片氾濫,怎麼識別 AI 產生的圖片?3 大 AI 內容識別技術 image-25

AI生成圖片氾濫,怎麼識別 AI 產生的圖片?3 大 AI 內容識別技術 image-25

使用者可以透過 C2PA 提供的驗證網站來取得圖片的內容憑證資訊,也可以使用這個工具確認別人交付給你的檔案是不是真實、非 AI 產生的圖片。

AI生成圖片氾濫,怎麼識別 AI 產生的圖片?3 大 AI 內容識別技術 image-26-1500x791

AI生成圖片氾濫,怎麼識別 AI 產生的圖片?3 大 AI 內容識別技術 image-26-1500x791

3. 資深老前輩:IPTC

不過並不是所有的 AI 廠商都有一樣的想法,Midjourney 和 Stability AI、Shutterstock 這幾家公司都宣布採用一個更古老,但支援性相對更高的 IPTC 中繼資料 (metadata) 來標記 AI 產生的內容。

AI生成圖片氾濫,怎麼識別 AI 產生的圖片?3 大 AI 內容識別技術 image-27

AI生成圖片氾濫,怎麼識別 AI 產生的圖片?3 大 AI 內容識別技術 image-27

IPTC 已經在影像業界已經成為其中的廣泛使用標準,如 Photoshop 等圖片編輯軟體也都可以直接編輯 IPTC 資訊。另外,Google 在 2023 年的 Google I/O 上也已經說明,未來在 Google 圖片搜尋結果中,將會參考 IPTC 的資訊來標記圖片。

不過截至目前為止,Midjourney 和 Shutterstock 都尚未將 IPTC 中繼資料加入 AI 產生的檔案中。

歡迎到《硬是要學》AI 專欄,瀏覽更多 AI 科技發展趨勢文章
avatar-img
1會員
4內容數
Hi 我是手哥!專研 3C 手機、家電,以及各種科技、AI、商務應用
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
手哥科科 的其他內容
今天 Google 發表了最新的 AI 模型 Gemini 1.5,不只提高模型訓練和服務效率,而且擁有更強大的理解力,每次能處理的 token 長度更是一口氣突破 100 萬大關,是競爭對手 GPT-4 的 7.8 倍 (GPT-4 目前只提供最長 32K 長度),可以處理更大量的資訊,也擁有更大
Google 近來宣佈在即將推出的 Chrome M121 版本中導入 3 個 AI 功能,包括整理分頁、建立個人主題和幫你寫,將增進使用者的瀏覽體驗。本文介紹這些新功能以及自 Google 推出 Gemini AI 模型後,AI 功能擴展至不同產品的趨勢。
今天 Google 發表了最新的 AI 模型 Gemini 1.5,不只提高模型訓練和服務效率,而且擁有更強大的理解力,每次能處理的 token 長度更是一口氣突破 100 萬大關,是競爭對手 GPT-4 的 7.8 倍 (GPT-4 目前只提供最長 32K 長度),可以處理更大量的資訊,也擁有更大
Google 近來宣佈在即將推出的 Chrome M121 版本中導入 3 個 AI 功能,包括整理分頁、建立個人主題和幫你寫,將增進使用者的瀏覽體驗。本文介紹這些新功能以及自 Google 推出 Gemini AI 模型後,AI 功能擴展至不同產品的趨勢。
你可能也想看
Google News 追蹤
Thumbnail
本文探討AI如何為企業帶來實際效益,並提供臺灣企業應用AI的建議,包含從自身優勢出發、快速迭代、培養AI人才等面向。文章並附上講師的相關資訊,包含聯絡方式、課程資訊及過往合作企業等。
Thumbnail
這問題在國外的 reddit 平台,引起廣大的討論 當我們搜尋「bady peacock」圖片時,搜尋結果中 畫紅線的,根本就不是真正的「孔雀幼鳥」圖片 而是由「AI 生成」的圖片 如果 搜尋引擎 沒辦法識別「AI 生成」的圖片, 隨著生成式 AI 繼續發展下去,A
Thumbnail
可能包含敏感內容
本文探討了AI生成圖片在性器官相關主題上的限制,特別是社群媒體的道德規範對生成內容的影響。作者透過自身經驗,詳細描述了在創作過程中遇到的挑戰,尤其是關於《國王的新衣》故事中使用透明衣服的生成限制。文章也引導讀者思考AI技術在創作領域的不足之處,並帶來反思與解讀的可能性。
Thumbnail
AI生成圖片是一個挑戰性的任務,雖然AI能理解文字需求,但仍無法完全想像心中的理想畫面。使用中文描述AI的生成效果約為5成到6成,而加入擬人化的描述可以讓AI更好地理解需求。無論如何,AI生成圖片仍面臨許多挑戰,需要更多的研究與嘗試。
Thumbnail
AI繪圖要廣泛用於商用還有一大段路,還需要依賴人類的經驗判斷、調整,為什麼呢?
Thumbnail
最近真的熱到足不出戶(雖然颱風要來了這兩天風很大),簡單列了幾個近期的夏日耍廢生活寫照,順便練習讓可愛的AI小狼演示一輪
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
今天想產出一些可愛風的動物擬人圖,所以簡單設定了蛋糕店的情境,果然整個色調跟風格都軟起來,希望可以療癒大家疲累的心~ 魔法咒語:baby ___ own and operate a cake shop
Thumbnail
使用AI所產出的資訊,必須審慎判讀取捨,不宜照單全收。
Thumbnail
最近AI圖和文章盛行,並沒有說這樣不好,現在也有AI圖和AI文比賽,聽人說有個攝影師用他拍的照片去參加AI圖比賽,結果被發現後退賽,我感到悲哀的是用AI去生成的作品還說是自己寫或畫的,尤其是免費的,設定收費的可能是想賺錢,那免費的又說是自己寫和畫是為什麼呢?滿足自己虛榮心嗎? 最近網路上也看到
Thumbnail
本文探討AI如何為企業帶來實際效益,並提供臺灣企業應用AI的建議,包含從自身優勢出發、快速迭代、培養AI人才等面向。文章並附上講師的相關資訊,包含聯絡方式、課程資訊及過往合作企業等。
Thumbnail
這問題在國外的 reddit 平台,引起廣大的討論 當我們搜尋「bady peacock」圖片時,搜尋結果中 畫紅線的,根本就不是真正的「孔雀幼鳥」圖片 而是由「AI 生成」的圖片 如果 搜尋引擎 沒辦法識別「AI 生成」的圖片, 隨著生成式 AI 繼續發展下去,A
Thumbnail
可能包含敏感內容
本文探討了AI生成圖片在性器官相關主題上的限制,特別是社群媒體的道德規範對生成內容的影響。作者透過自身經驗,詳細描述了在創作過程中遇到的挑戰,尤其是關於《國王的新衣》故事中使用透明衣服的生成限制。文章也引導讀者思考AI技術在創作領域的不足之處,並帶來反思與解讀的可能性。
Thumbnail
AI生成圖片是一個挑戰性的任務,雖然AI能理解文字需求,但仍無法完全想像心中的理想畫面。使用中文描述AI的生成效果約為5成到6成,而加入擬人化的描述可以讓AI更好地理解需求。無論如何,AI生成圖片仍面臨許多挑戰,需要更多的研究與嘗試。
Thumbnail
AI繪圖要廣泛用於商用還有一大段路,還需要依賴人類的經驗判斷、調整,為什麼呢?
Thumbnail
最近真的熱到足不出戶(雖然颱風要來了這兩天風很大),簡單列了幾個近期的夏日耍廢生活寫照,順便練習讓可愛的AI小狼演示一輪
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
今天想產出一些可愛風的動物擬人圖,所以簡單設定了蛋糕店的情境,果然整個色調跟風格都軟起來,希望可以療癒大家疲累的心~ 魔法咒語:baby ___ own and operate a cake shop
Thumbnail
使用AI所產出的資訊,必須審慎判讀取捨,不宜照單全收。
Thumbnail
最近AI圖和文章盛行,並沒有說這樣不好,現在也有AI圖和AI文比賽,聽人說有個攝影師用他拍的照片去參加AI圖比賽,結果被發現後退賽,我感到悲哀的是用AI去生成的作品還說是自己寫或畫的,尤其是免費的,設定收費的可能是想賺錢,那免費的又說是自己寫和畫是為什麼呢?滿足自己虛榮心嗎? 最近網路上也看到