AI在偷偷抓我網站內容甚至隱私資料? 你要用來人工模型訓練，要先講欸！

更新於 2024/09/30發佈於 2023/10/01閱讀時間約 2 分鐘

相信這是老生常談了，網路世代加上科技的隨之普及，現在人人穿梭在網路世界已司空見慣，無遠弗屆一詞再也不是誇飾，而是歷歷在目的現象。

網路世代孕育出一些部落客、出版文字業者，舉凡擁有自己網站的經營相關人士，那網站的背後無盡的知識寶庫、優質內容到更隱私的後台觀看人數、客群、SEO相關的數據都是這些人的重要資產。但你可曾擔憂過這些無價之寶被人偷偷用網路爬蟲給無情複製、拿去餵餵AI智慧模型訓練則輕，如果是有心人士拿去做一些偷來暗去的則事情大條。

最大被針對討論的無非是我們的Google大哥，坐擁搜尋引擎首選寶座的他儘管前陣子遭受Microsoft的Edge小小的威脅，如今海水稍稍退潮後Google卻還是穩穩地站在浪潮中穿穩褲子。也因此，許多文字創作者、專家學者、或科技界的商務人士等都暗暗質疑過Google一直以來到底有沒有偷偷拿大家的資料去做AI訓練呢?!

大家放心！Google信任部門副總(Trust of VP)，Danielle Romain，幾天前宣布新的功能。在不久的未來，網站搜尋索引文件檔robots.txt將增加新控制功能，讓這些出版業者或網站所有人能自由選擇「是否提供相關內容，協助人工智慧服務「Bard」，以及Google Cloud的Vertex AI等在未來更加進步。

在翻的白話點就是：未來如果他們要拿你的網站內容去訓練自家AI的話，都會先徵求你的同意，而不會直接拿走。

Source: Meme梗圖倉庫

但是...修但幾咧，現在Bard就是一款經過好幾層訓練出來的人工智慧了，早就把網路上的資料當把費吃一輪，現在才問會不會有點先斬後奏?

巧合的是，另一個網路文章發佈平台Medium跟上其他大型媒體新聞平台，如CNN、NY Times的行列，也在幾日前禁止一些機器人未經知會的自動爬蟲、非經作者同意剽竊內容去訓練AI的功能。

如此措施施行能保障這些創作者的文字都有被使用前尊重的重視，甚至是有拒絕被使用的權利；然而大數據世代普及化，許多數據公司、行銷公司為了讓AI吃更飽長更大而不停索求資料、甚至為了時間的迫切未經同意的資料也照單全收。

要怎麼去衡量「資料量足夠讓大型模型能夠持續茁壯」，與「在商業上的所可能引發的資安等疑慮」，恐怕還有很長的時間要來進行討論。

Ref:

https://techcrunch.com/2023/09/28/your-website-can-now-opt-out-of-training-googles-bard-and-future-ais/

https://techcrunch.com/2023/09/28/medium-hints-at-a-nascent-media-coalition-to-block-ai-crawlers/

7會員

12內容數

留言0

查看全部

發表第一個留言支持創作者！

JuRood的沙龍的其他內容

手機之於我好比魚之於水?!

科技始終來自於人性，科技冷漠是人性嗎?! 低頭族某種程度來說，能不能算被科技支配，那科幻電影機器人操縱人腦的世代將會即將來臨嗎?! 還是你能擺脫手機的束縛，真真切切的返璞歸真呢

#科技 #手機 #企業家

印度科技水平將昇華？！輝達集團攜手印度企業打造更具規模的「大型語言模型」

OpenAI的ChatGPT爆炸性成長，彷彿是蠟筆小新–《大人帝國的反擊》中，反派阿健所釋放的20世紀味道，嗅到這股AI氣息的人類紛紛投入無法自拔的使用ChatGPT、並迅速在世界各國蔓延開來。黃仁勳訪印度又有甚麼實質意義呢? 封面圖：工商時報

#ChatGPT #NVIDIA #印度

社群媒體爭霸戰之風水輪流轉，沒想過竟然是「它」笑到最後?!

社群媒體車輪戰，社群媒體有毒阿！！到底現今社會來看，人類對於Social Media的追求目的有什麼樣的不同?

#Threads #Twitter #Instagram

Danone達能集團宣布牽一髮動全身的計畫！減碳力道不如減甲烷量排放?!

上禮拜提到的EVIAN礦泉水的母公司達能Danone公司，這禮拜也是各大環境永續議題相關外媒的爭相報導對象。這個在2022CDP(Carbon Disclosure Project)碳揭露專案榮少數三項專案都拿A的環境保護資優生，這周宣布甚麼環境相關的策略改革呢?! 封面牛牛圖來源：esg tod

#全球暖化 #ESG #SDGs

不是進口水我可是不喝的哦！Evian天然礦泉水, Activia優格所屬公司達能Danone被控訴不夠環保?!

不是進口水我可是不喝的哦！法國食品業龍頭達能公司原本是拿3個A的環保好寶寶，怎麼會在今年年初就被別人控告其實是壞胚子一個呢?!

#塑膠 #環保 #ESG

手機之於我好比魚之於水?!

#科技 #手機 #企業家

印度科技水平將昇華？！輝達集團攜手印度企業打造更具規模的「大型語言模型」

#ChatGPT #NVIDIA #印度

社群媒體爭霸戰之風水輪流轉，沒想過竟然是「它」笑到最後?!

社群媒體車輪戰，社群媒體有毒阿！！到底現今社會來看，人類對於Social Media的追求目的有什麼樣的不同?

#Threads #Twitter #Instagram

Danone達能集團宣布牽一髮動全身的計畫！減碳力道不如減甲烷量排放?!

#全球暖化 #ESG #SDGs

不是進口水我可是不喝的哦！Evian天然礦泉水, Activia優格所屬公司達能Danone被控訴不夠環保?!

不是進口水我可是不喝的哦！法國食品業龍頭達能公司原本是拿3個A的環保好寶寶，怎麼會在今年年初就被別人控告其實是壞胚子一個呢?!

#塑膠 #環保 #ESG

你可能也想看

Google News 追蹤

極致數位行銷的沙龍

2024/10/10

如何「禁止 AI 模型」爬取您網站的內容進行 AI 訓練？

如果你想要「禁止 AI 模型」爬取您網站的內容進行 AI 訓練那就可以參考 threads 的 robots.txt 檔案 robots.txt 是一個放在網站根目錄的檔案大多數的合法爬蟲，都會尊重網站所寫的規定可以看到，threads 平台禁止了多數 AI 模型的專用

默默超的人機協作城

2024/07/11

AI助手數據收集和訓練過程簡介

本文介紹了AI助手在數據收集和訓練過程中的工作原理和不斷進步的過程。關注的內容包括從公開的網絡資源、書籍、文章等渠道收集數據，數據的清洗和結構化處理，知識庫的增量更新以及訓練算法和模型的優化。如果大家對AI助手的發展還有任何其他感興趣的話題或建議，歡迎隨時告訴我們，讓我們共同探索，攜手進步。

#數據 #學習 #模型

王啟樺的沙龍

2024/07/10

D013｜現在的AI，就是20年前的網際網路

有網際網路以後，的確任何的資訊都可以在網路上搜尋到，但一個很大的問題就是「資訊是破碎的」。這也就造成有些人的工作，就是專門收集網路上的訊息，整理出系統，制訂框架，寫出一篇篇充滿資源連結的文章，作為導覽讀者遨遊網路的領路人。而現在AI 出現，這些領路人，可以把工作做得更好！

使用AI所產出的資訊，必須審慎判讀取捨，不宜照單全收。

#AI #生成式AI

學習玩家｜啟動玩心學習

2024/04/20

AI 改變我的「搜尋」習慣了：以前從凡事問 Google 大神，現在不如跟生成式 AI 聊聊

生成式AI對搜尋方式帶來了革新， ChatGPT、Gemini和perplexity都是一些值得關注的工具。生成式AI提供參考來源，讓使用者可以查證回覆內容，並提供相關的資訊與建議。在研究與創作時，透過持續對話，AI也可以成為有效率的參考夥伴。對於教學創作也有很好的應用。

#搜尋 #ChatGPT #生成式AI

Marcos的方格子

2024/04/13

如何安全地部屬 AI 應用程式在 Google Cloud : 最佳實踐

人工智慧的出現協助企業創造下一波的成長紅利，但是也導致資安上的諸多挑戰，本篇整理 Best Practices for Securely Deploying AI on Google Cloud 和相關參考資料，希望藉由各種解決方案和最佳實踐，在使用人工智慧的同時也減少其帶來的安全性風險。

#GoogleCloud #GCP #cybersecurity

murguia amiya的沙龍

2024/03/15

搜尋引擎優化在人工智慧時代的前景

隨著人工智慧技術的不斷發展和應用，搜尋引擎優化（SEO）在網路行銷領域中的地位和作用日益凸顯，展示出了嶄新的前景和發展機遇。讓我們一同探討在人工智慧時代，SEO將如何塑造網路行銷的未來。首先，人工智慧技術的應用將使SEO更加智能化和精準化。通過機器學習和大數據分析，搜尋引擎可以更好地理解用戶的搜

Samuel的沙龍

2024/02/26

Google首席執行官桑達爾·皮查伊強調人工智慧展現抵禦網絡安全威脅方面的重大潛力。

Google首席執行官桑達爾·皮查伊表示，人工智慧的快速進步可能增強對抗網絡安全威脅的能力。隨著全球經濟因網絡攻擊而蒙受巨大損失，Google倡議提升在線安全並對AI工具的誤用進行預防。

#Google #威脅 #OpenAI

阿漁慵懶中求生存

2024/01/17

天下雜誌│人類與AI互相競爭的未來已揭開序幕

《紐約時報》控告微軟，大量使用他們的報導文章去訓練AI，他們宣稱這是侵權的非法行為。

#侵權 #法律 #文章