「文字與資料探勘」（TDM）是什麼？

2025/08/03 更新2024/03/31 發佈閱讀 3 分鐘

文字與資料探勘（Text and Data Mining，TDM）是指自動化分析大量的資料，以識別出其中的模式或規律，以萃取出有價值的資訊。TDM 結合了自然語言處理（NLP）、機器學習（ML）、統計分析等技術，能夠處理和分析大量的非結構化數據，以發現隱藏的趨勢、模式和關聯性。從學術研究到商業情報，從公共政策分析到市場趨勢預測，TDM 的應用範圍廣泛，其重要性不言而喻。

Image: DALL·E

然而，在資料探勘的執行過程中，往往需要處理和分析受著作權保護的內容。依照大部分國家的著作權法，未經著作權人同意，重製或散佈受著作權保護的內容是違法的。而資料探勘過程中常需要將著作權人的創作在電腦中建立臨時的副本，甚至會自動產生新的衍生內容，這些步驟都可能被視為侵犯著作權。

為了確保此種資料探勘不會侵犯著作權，一些國家在著作權法中引入 TDM 例外條款。例如歐盟在 2019 年通過的《數位單一市場著作權指令》，允許研究機構等非營利組織為了資料探勘的目的而重製受保護的作品，然而若資料探勘是為了商業活動，則著作權人可以拒絕作品被使用。相較之下，日本的 TDM 例外條款就更為全面，只要不利用原作者的表達方式，允許研究者可以以任何目的進行 TDM，甚至直接複製有著作權的作品並擷取其中的知識。¹

美國則較為不同，是以合理使用（Fair Use）原則來保護 TDM，也運作得還算良好。例如 Google 在 Google Book Search （GBS）計畫中，將合作圖書館的上百萬本紙本書籍進行掃描及數位化，供學術研究尋找資料之用。而作為交換，圖書館則可以獲得這些書籍的數位檔案。這雖然是明顯的複製了有著作權的內容，但被法官認為是對社會有益的合理使用。

然而，即使有例外條款，在實際運作 TDM 時仍有許多障礙，例如：

作品可能被數位版權管理（Digital Rights Management）技術所保護
仍有可能侵犯資料庫（database）的特別權（sui generis）
必須遵守個人隱私或是資安的相關法規

隨著人工智慧和大數據分析的重要性不斷提升，文字與資料探勘將在更多領域發揮舉足輕重的作用。若能營造一個有利技術發展的法律框架，才可讓新興技術發揮潛力，創造更多有價值的貢獻。

留言

IP聊天室

4會員

162內容數

喜愛學東學西，總說略懂略懂。希望簡單的文字，讓更多人了解智慧財產權。相信觀點的碰撞，才能帶來成長。

IP聊天室的其他內容

2024/03/13

光影與法律：攝影著作權的歷史之旅

攝影著作權有著曲折而漫長的歷史。從最初被視為無法受到保護，到現今獲得與其他藝術作品相同的法律地位，攝影著作權的發展過程反映了社會對攝影的認知演變，以及立法者因應新興技術所做出的回應。攝影誕生之初：被視為機械複製品 1826 年，法國發明家尼埃普斯（Nicéphore Niépce）在錫板上製作

2024/03/13

光影與法律：攝影著作權的歷史之旅

2024/03/08

MP3.com 的崛起與衰落

音樂網站「MP3.com」是音樂產業在網路泡沫時期的重大事件之一。創辦人 Michael Robertson 和 Greg Flores 原本只是想利用 MP3.com 這個網域名稱，為自己的檔案搜索網站 filez.com 吸引更多流量1。但 MP3.com 在 1997 年上線後，意外吸引了大量

2024/03/08

MP3.com 的崛起與衰落

2024/03/08

「原創性」（originality）是什麼？

著作權法旨在保護文學、藝術和科學作品，而原創性（originality）是著作權保護的核心概念之一，指的是作品必須源於作者的創意，而非抄襲他人的成果。 Photo credit: Hgantunez (wikimedia) 在不同的法律體系和文化背景下，著作權的保護標準有所不同。國家間則透過

2024/03/08

「原創性」（originality）是什麼？

看更多

你可能也想看

k.S的量化投資

【深度解讀】打破百萬門檻迷思：小資族如何透過「債券孳息」打造優於定存的美元現金流？

債券投資，不只是高資產族群的遊戲在傳統的投資觀念中，海外債券（Overseas Bonds）常被貼上「高資產族群專屬」的標籤。過去動輒 1 萬甚至 10 萬美元的最低申購門檻，讓許多想尋求穩定配息的小資族望而卻步。然而，在股市波動劇烈的環境下，尋求穩定的美元現金流與被動收入成為許多投資人

#玉山證券#海外債券#債券孳息

2026/02/06

k.S的量化投資

【深度解讀】打破百萬門檻迷思：小資族如何透過「債券孳息」打造優於定存的美元現金流？

#玉山證券#海外債券#債券孳息

2026/02/06

Jorge2006的沙龍

玉山證券小額債—川普又來報明牌啦!

透過川普的近期債券交易揭露，探討債券作為資產配置中「穩定磐石」的重要性。文章分析降息對債券的潛在影響，以及股神巴菲特的操作策略。並介紹玉山證券「小額債」平臺，如何讓小資族也能低門檻參與海外債券市場，實現「低門檻、低波動、固定收益」的務實投資方式。

2026/03/13

2026/03/13

拒絕梭哈投資，建立財務餘裕｜玉山證券小額債為你打造資產穩定錨

解析「債券」如何成為資產配置中的穩定錨，提供低風險高回報的投資選項。藉由玉山證券的低門檻債券服務，投資者可輕鬆入手，平衡風險並穩定財務。

#投資#資產配置#債券投資

2026/03/13

CK On Board

拒絕梭哈投資，建立財務餘裕｜玉山證券小額債為你打造資產穩定錨

#投資#資產配置#債券投資

2026/03/13

小芝女看天下

任何人都能投資！用玉山證券小額債替自己存旅費：1,000 美元就能開始的穩健理財法

相較於波動較大的股票，債券能提供固定現金流，而玉山證券推出的小額債，更以1000 美元的低門檻，讓學生與新手也能參與全球優質企業債投資。玉山E-Trader平台即時報價、條件式篩選與清楚的交易流程等特色，大幅降低投資難度，對於希望分散風險、建立穩定現金流的人來說，玉山小額債是一個值得嘗試的理財起點。

#玉山小額債#小額債#玉山證券

2026/02/12