資料探勘(Text and Data Mining,TDM)是指自動從大量的文字或資料中擷取資訊。TDM 的應用範圍十分廣泛,例如製藥公司可以快速篩選出具有療效的化合物,金融機構則可以分析市場趨勢以優化投資策略。

然而,由於這些資料通常受到著作權法的保護,若未經授權便進行探勘分析,可能構成侵權。為了促進創新並釐清法律規範,歐盟在 2019 年通過了「數位單一市場著作權指令」(Directive on Copyright in the Digital Single Market),其中第 3 條和第 4 條專門針對 TDM 提供例外。
法規沿革
雖然 2001 年《資訊社會著作權指令》(InfoSoc Directive)中的例外條款,可能已經涵蓋部分 TDM 行為,例如第 5 條第 1 項的暫時性重製(temporary acts of reproduction)。然而這些例外的適用範圍非常有限,無法為大多數的 TDM 行為提供足夠的法律確定性。
此外,InfoSoc Directive 的一些例外條款屬於選擇性規定,各國可自行決定是否納入國內法,導致歐盟內部的法律碎片化問題更加嚴重,也使跨境的 TDM 研究專案更加難以判斷其合法性。因此在此時期要合法進行 TDM 可能非常複雜,而技術保護措施(Technological Protection Measures)也可能阻礙 TDM 的進行。
另外,在歐盟通過 TDM 指令之前,部分成員國已經在其國內法中實施了 TDM 例外條款。例如英國在 2014 年修改著作權法,允許為非商業性研究目的 TDM。(雖然現今的英國已經不再是歐盟的一部分)
有鑑於此,歐盟執委會(European Commission)在 2016 年提出「數位單一市場著作權指令」草案,希望建立一致的 TDM 規範。歷經三年多的討論修正,歐洲議會(European Parliament)在 2019 年 4 月通過最終版本,其中第 3 條和第 4 條規定了 TDM 的例外條款,以促進歐盟的科學研究和創新。
第 3 條規定,為科學研究目的進行 TDM 的研究機構和文化遺產機構可以複製受著作權保護的作品。但各國的實施則各有異同:
- 義大利等國在實施時擴大了此條款的適用範圍,允許受益人(也就是使用文字及資料的一方)為了表達研究成果而向公眾傳播新的原創作品。
- 奧地利及德國將獨立研究人員納入受益人之列。
第 4 條的適用範圍更廣,涵蓋了所有類型的受益人和目的,但權利人可以「以適當方式」保留權利,阻止他人進行 TDM。各國在實施這一「退出機制」時也存在分歧。有些國家沒有具體說明權利保留的形式,有些國家提到了機器可讀的方式,還有一些國家要求權利人只能使用機器可讀的方式保留權利。
另外,無論是第 3 條或第 4 條,都提到 TDM 的前提是「合法近用」(lawful access)。也就是說,無論是付費或免費取得,都需要透過合法的途徑取得內容。然而 TDM 指令並未明確說明「合法近用」的條件。例如,除了使用者的行為是否合法外,內容本身是否必須是合法的,也時常引發爭議。
整體來說,歐盟為 TDM 設立了強制性的著作權例外條款,但由於條款本身的侷限性,使成員國在實施上仍有差異。近年由於人工智慧的發展,歐盟及其成員國還需要進一步完善相關規則,並協調立法以消除障礙。