AI在偷偷抓我網站內容甚至隱私資料? 你要用來人工模型訓練,要先講欸!

更新於 發佈於 閱讀時間約 2 分鐘
相信這是老生常談了,網路世代加上科技的隨之普及,現在人人穿梭在網路世界已司空見慣,無遠弗屆一詞再也不是誇飾,而是歷歷在目的現象。

網路世代孕育出一些部落客、出版文字業者,舉凡擁有自己網站的經營相關人士,那網站的背後無盡的知識寶庫優質內容到更隱私的後台觀看人數客群SEO相關的數據都是這些人的重要資產。但你可曾擔憂過這些無價之寶被人偷偷用網路爬蟲給無情複製、拿去餵餵AI智慧模型訓練則輕,如果是有心人士拿去做一些偷來暗去的則事情大條。

最大被針對討論的無非是我們的Google大哥,坐擁搜尋引擎首選寶座的他儘管前陣子遭受Microsoft的Edge小小的威脅,如今海水稍稍退潮後Google卻還是穩穩地站在浪潮中穿穩褲子。也因此,許多文字創作者、專家學者、或科技界的商務人士等都暗暗質疑過Google一直以來到底有沒有偷偷拿大家的資料去做AI訓練呢?!

大家放心!Google信任部門副總(Trust of VP),Danielle Romain,幾天前宣布新的功能。在不久的未來,網站搜尋索引文件檔robots.txt將增加新控制功能,讓這些出版業者或網站所有人能自由選擇「是否提供相關內容,協助人工智慧服務「Bard」,以及Google Cloud的Vertex AI等在未來更加進步。

在翻的白話點就是:未來如果他們要拿你的網站內容去訓練自家AI的話,都會先徵求你的同意,而不會直接拿走。
Source: Meme梗圖倉庫

Source: Meme梗圖倉庫

但是...修但幾咧,現在Bard就是一款經過好幾層訓練出來的人工智慧了,早就把網路上的資料當把費吃一輪,現在才問會不會有點先斬後奏?

巧合的是,另一個網路文章發佈平台Medium跟上其他大型媒體新聞平台,如CNN、NY Times的行列,也在幾日前禁止一些機器人未經知會的自動爬蟲、非經作者同意剽竊內容去訓練AI的功能。

如此措施施行能保障這些創作者的文字都有被使用前尊重的重視,甚至是有拒絕被使用的權利;然而大數據世代普及化,許多數據公司、行銷公司為了讓AI吃更飽長更大而不停索求資料、甚至為了時間的迫切未經同意的資料也照單全收。

要怎麼去衡量「資料量足夠讓大型模型能夠持續茁壯」,與「在商業上的所可能引發的資安等疑慮」,恐怕還有很長的時間要來進行討論。



Ref:

https://techcrunch.com/2023/09/28/your-website-can-now-opt-out-of-training-googles-bard-and-future-ais/

https://techcrunch.com/2023/09/28/medium-hints-at-a-nascent-media-coalition-to-block-ai-crawlers/

avatar-img
7會員
12內容數
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
JuRood的沙龍 的其他內容
科技始終來自於人性,科技冷漠是人性嗎?! 低頭族某種程度來說,能不能算被科技支配,那科幻電影機器人操縱人腦的世代將會即將來臨嗎?! 還是你能擺脫手機的束縛,真真切切的返璞歸真呢
OpenAI的ChatGPT爆炸性成長,彷彿是蠟筆小新–《大人帝國的反擊》中,反派阿健所釋放的20世紀味道,嗅到這股AI氣息的人類紛紛投入無法自拔的使用ChatGPT、並迅速在世界各國蔓延開來。黃仁勳訪印度又有甚麼實質意義呢? 封面圖:工商時報
社群媒體車輪戰,社群媒體有毒阿!!到底現今社會來看,人類對於Social Media的追求目的有什麼樣的不同?
上禮拜提到的EVIAN礦泉水的母公司達能Danone公司,這禮拜也是各大環境永續議題相關外媒的爭相報導對象。這個在2022CDP(Carbon Disclosure Project)碳揭露專案榮少數三項專案都拿A的環境保護資優生,這周宣布甚麼環境相關的策略改革呢?! 封面牛牛圖來源:esg tod
不是進口水我可是不喝的哦!法國食品業龍頭達能公司原本是拿3個A的環保好寶寶,怎麼會在今年年初就被別人控告其實是壞胚子一個呢?!
科技始終來自於人性,科技冷漠是人性嗎?! 低頭族某種程度來說,能不能算被科技支配,那科幻電影機器人操縱人腦的世代將會即將來臨嗎?! 還是你能擺脫手機的束縛,真真切切的返璞歸真呢
OpenAI的ChatGPT爆炸性成長,彷彿是蠟筆小新–《大人帝國的反擊》中,反派阿健所釋放的20世紀味道,嗅到這股AI氣息的人類紛紛投入無法自拔的使用ChatGPT、並迅速在世界各國蔓延開來。黃仁勳訪印度又有甚麼實質意義呢? 封面圖:工商時報
社群媒體車輪戰,社群媒體有毒阿!!到底現今社會來看,人類對於Social Media的追求目的有什麼樣的不同?
上禮拜提到的EVIAN礦泉水的母公司達能Danone公司,這禮拜也是各大環境永續議題相關外媒的爭相報導對象。這個在2022CDP(Carbon Disclosure Project)碳揭露專案榮少數三項專案都拿A的環境保護資優生,這周宣布甚麼環境相關的策略改革呢?! 封面牛牛圖來源:esg tod
不是進口水我可是不喝的哦!法國食品業龍頭達能公司原本是拿3個A的環保好寶寶,怎麼會在今年年初就被別人控告其實是壞胚子一個呢?!
你可能也想看
Google News 追蹤
Thumbnail
現代社會跟以前不同了,人人都有一支手機,只要打開就可以獲得各種資訊。過去想要辦卡或是開戶就要跑一趟銀行,然而如今科技快速發展之下,金融App無聲無息地進到你生活中。但同樣的,每一家銀行都有自己的App時,我們又該如何選擇呢?(本文係由國泰世華銀行邀約) 今天我會用不同角度帶大家看這款國泰世華CUB
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
如果你想要「禁止 AI 模型」爬取您網站的內容進行 AI 訓練 那就可以參考 threads 的 robots.txt 檔案 robots.txt 是一個放在網站根目錄的檔案 大多數的合法爬蟲,都會尊重網站所寫的規定 可以看到,threads 平台禁止了多數 AI 模型的專用
Thumbnail
本文介紹了AI助手在數據收集和訓練過程中的工作原理和不斷進步的過程。關注的內容包括從公開的網絡資源、書籍、文章等渠道收集數據,數據的清洗和結構化處理,知識庫的增量更新以及訓練算法和模型的優化。如果大家對AI助手的發展還有任何其他感興趣的話題或建議,歡迎隨時告訴我們,讓我們共同探索,攜手進步。
有網際網路以後,的確任何的資訊都可以在網路上搜尋到, 但一個很大的問題就是「資訊是破碎的」。 這也就造成有些人的工作, 就是專門收集網路上的訊息,整理出系統,制訂框架, 寫出一篇篇充滿資源連結的文章, 作為導覽讀者遨遊網路的領路人。 而現在AI 出現,這些領路人,可以把工作做得更好!
Thumbnail
使用AI所產出的資訊,必須審慎判讀取捨,不宜照單全收。
Thumbnail
生成式AI對搜尋方式帶來了革新, ChatGPT、Gemini和perplexity都是一些值得關注的工具。生成式AI提供參考來源,讓使用者可以查證回覆內容,並提供相關的資訊與建議。在研究與創作時,透過持續對話,AI也可以成為有效率的參考夥伴。對於教學創作也有很好的應用。
Thumbnail
人工智慧的出現協助企業創造下一波的成長紅利,但是也導致資安上的諸多挑戰,本篇整理 Best Practices for Securely Deploying AI on Google Cloud 和相關參考資料,希望藉由各種解決方案和最佳實踐,在使用人工智慧的同時也減少其帶來的安全性風險。
隨著人工智慧技術的不斷發展和應用,搜尋引擎優化(SEO)在網路行銷領域中的地位和作用日益凸顯,展示出了嶄新的前景和發展機遇。讓我們一同探討在人工智慧時代,SEO將如何塑造網路行銷的未來。 首先,人工智慧技術的應用將使SEO更加智能化和精準化。通過機器學習和大數據分析,搜尋引擎可以更好地理解用戶的搜
Thumbnail
Google首席執行官桑達爾·皮查伊表示,人工智慧的快速進步可能增強對抗網絡安全威脅的能力。隨著全球經濟因網絡攻擊而蒙受巨大損失,Google倡議提升在線安全並對AI工具的誤用進行預防。
Thumbnail
《紐約時報》控告微軟, 大量使用他們的報導文章去訓練AI, 他們宣稱這是侵權的非法行為。
Thumbnail
現代社會跟以前不同了,人人都有一支手機,只要打開就可以獲得各種資訊。過去想要辦卡或是開戶就要跑一趟銀行,然而如今科技快速發展之下,金融App無聲無息地進到你生活中。但同樣的,每一家銀行都有自己的App時,我們又該如何選擇呢?(本文係由國泰世華銀行邀約) 今天我會用不同角度帶大家看這款國泰世華CUB
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
如果你想要「禁止 AI 模型」爬取您網站的內容進行 AI 訓練 那就可以參考 threads 的 robots.txt 檔案 robots.txt 是一個放在網站根目錄的檔案 大多數的合法爬蟲,都會尊重網站所寫的規定 可以看到,threads 平台禁止了多數 AI 模型的專用
Thumbnail
本文介紹了AI助手在數據收集和訓練過程中的工作原理和不斷進步的過程。關注的內容包括從公開的網絡資源、書籍、文章等渠道收集數據,數據的清洗和結構化處理,知識庫的增量更新以及訓練算法和模型的優化。如果大家對AI助手的發展還有任何其他感興趣的話題或建議,歡迎隨時告訴我們,讓我們共同探索,攜手進步。
有網際網路以後,的確任何的資訊都可以在網路上搜尋到, 但一個很大的問題就是「資訊是破碎的」。 這也就造成有些人的工作, 就是專門收集網路上的訊息,整理出系統,制訂框架, 寫出一篇篇充滿資源連結的文章, 作為導覽讀者遨遊網路的領路人。 而現在AI 出現,這些領路人,可以把工作做得更好!
Thumbnail
使用AI所產出的資訊,必須審慎判讀取捨,不宜照單全收。
Thumbnail
生成式AI對搜尋方式帶來了革新, ChatGPT、Gemini和perplexity都是一些值得關注的工具。生成式AI提供參考來源,讓使用者可以查證回覆內容,並提供相關的資訊與建議。在研究與創作時,透過持續對話,AI也可以成為有效率的參考夥伴。對於教學創作也有很好的應用。
Thumbnail
人工智慧的出現協助企業創造下一波的成長紅利,但是也導致資安上的諸多挑戰,本篇整理 Best Practices for Securely Deploying AI on Google Cloud 和相關參考資料,希望藉由各種解決方案和最佳實踐,在使用人工智慧的同時也減少其帶來的安全性風險。
隨著人工智慧技術的不斷發展和應用,搜尋引擎優化(SEO)在網路行銷領域中的地位和作用日益凸顯,展示出了嶄新的前景和發展機遇。讓我們一同探討在人工智慧時代,SEO將如何塑造網路行銷的未來。 首先,人工智慧技術的應用將使SEO更加智能化和精準化。通過機器學習和大數據分析,搜尋引擎可以更好地理解用戶的搜
Thumbnail
Google首席執行官桑達爾·皮查伊表示,人工智慧的快速進步可能增強對抗網絡安全威脅的能力。隨著全球經濟因網絡攻擊而蒙受巨大損失,Google倡議提升在線安全並對AI工具的誤用進行預防。
Thumbnail
《紐約時報》控告微軟, 大量使用他們的報導文章去訓練AI, 他們宣稱這是侵權的非法行為。