
AI版權大戰開打!BBC怒告Perplexity「逐字盜用」內容
AI的浪潮席捲全球,但也帶來了前所未有的版權挑戰。近日,英國廣播公司(BBC)就槓上了一家名為Perplexity的AI新創公司,一場潛在的法律大戰似乎不可避免。讓我們理性吃瓜,看看這場風波背後,究竟是技術的進步還是權益的侵犯。
BBC的指控:內容遭「逐字重現」,損害聲譽與收入
BBC在致Perplexity執行長Aravind Srinivas的信中措辭強硬,指控Perplexity的AI工具未經授權,大量複製BBC的新聞內容,甚至「逐字重現」,並在搜尋結果中直接提供BBC網站連結,導致使用者無需訪問BBC平台,直接衝擊了BBC的流量和廣告收入。BBC認為,這種行為不僅違反了英國著作權法和BBC的使用條款,更損害了BBC在公眾,特別是付費用戶心中的信任與聲譽。BBC更指出,今年初的內部研究發現,Perplexity對BBC新聞內容的摘要存在重大問題,約有17%包含事實錯誤、引用不當或缺乏關鍵背景。
Perplexity的反擊:指責BBC「操弄投機」,並誤解科技與法律
面對BBC的指控,Perplexity的回應也毫不示弱。Perplexity公開聲明,批評BBC的指控是「操弄且投機」,並反指BBC「根本誤解了科技、網路與智慧財產權法」。Perplexity強調,他們並非直接訓練大型語言模型,而是作為一個搜尋引擎,串接OpenAI、Google等現有AI模型,因此其技術應屬於合理使用(fair use)範疇。更有甚者,Perplexity認為BBC的法律行動是為了維護Google在搜尋市場的壟斷地位,而非真正關心內容版權。
關鍵爭議:內容抓取(Content Scraping)與 Robots.txt
這場爭議的核心在於AI公司如何獲取和使用網路內容,也就是所謂的「內容抓取」(content scraping)。BBC在信中指出,儘管他們已在網站上設置了robots.txt檔案,指示Perplexity的網路爬蟲(crawler)不要訪問特定頁面和內容,但Perplexity顯然並未遵守這些指示。值得注意的是,robots.txt並無法強制約束網路爬蟲,遵守與否取決於爬蟲開發者的意願。Perplexity執行長Aravind Srinivas則曾在去年6月接受Fast Company採訪時否認其爬蟲忽略robots.txt指令。Perplexity也聲稱,由於他們不構建基礎模型,因此不會將網站內容用於AI模型預訓練。
出版業的擔憂:AI威脅44億英鎊產業
除了BBC之外,英國專業出版協會(PPA)也表達了對AI平台侵犯版權的擔憂。PPA代表超過300家媒體品牌,他們認為AI公司非法抓取出版商的內容來訓練模型,這種行為直接威脅了英國價值44億英鎊的出版產業以及55,000個就業崗位。
AI版權爭議:冰山一角
BBC與Perplexity的爭端,只是AI版權爭議的冰山一角。近年來,隨著AI技術的快速發展,越來越多的媒體和內容創作者開始關注自己的作品被AI公司未經授權使用的問題。包括《紐約時報》、《Forbes》和《Wired》等媒體都曾指控Perplexity抄襲其內容。《紐約時報》甚至在去年10月向Perplexity發出了「停止侵權通知」(cease and desist notice)。另一方面,迪士尼和環球影業也因圖像生成器Midjourney涉嫌抄襲版權提起訴訟。
Perplexity的崛起:估值上看140億美元
儘管面臨諸多版權爭議,Perplexity的發展勢頭依然強勁。這家公司背後有亞馬遜創辦人Jeff Bezos、AI巨頭Nvidia和日本軟銀等重量級投資者。據《華爾街日報》報導,Perplexity正在進行新一輪5億美元的融資,估值可能達到140億美元。Perplexity聲稱,他們的AI聊天機器人每天處理3000萬個查詢,並以每月20美元的價格提供Perplexity Pro訂閱服務。
這場BBC與Perplexity的法律糾紛,無疑將成為AI版權領域的一個重要案例。它不僅關乎BBC的權益,也將影響整個內容產業的未來。在AI技術不斷發展的同時,如何平衡技術創新與版權保護,將是各方需要共同面對的課題。這場戰役的結果,或許將為AI時代的內容創作和使用,劃下一道新的界線。