1️⃣ Lawsnote 案背景與爭議
Lawsnote(七法公司) 自2016年創立以來,以「法律界的Google」自居,主打AI技術、語意分析,提供法規和判決書的快速搜尋服務,獲得許多新創圈好評。
然而2025年6月,新北地方法院針對法源資訊公司的告訴做出一審判決,認定Lawsnote未經授權大量重製法源整理的法規沿革、附件資料,構成:
- 著作權法第91條「意圖銷售而擅自重製他人著作」罪
- 刑法第359條「無故取得他人電腦電磁紀錄罪」
✅ 爭點關鍵在:
- 法規條文本身是公共財(著作權法第9條排除保護)
- 但「法規沿革、版本附件」經人工整理、校正、格式化 → 法院依著作權法第7條認定是「編輯著作」 → 受保護
法院認為,七法透過爬蟲大規模抓取法源網站資料、存進自家資料庫、對外收費使用,已構成「重製」受保護內容。
2️⃣ 爬蟲技術本身是否違法?
「爬蟲是常見技術,Google、Agoda、比價網都用,台大法律系也教學生寫爬蟲。」
✅ 這個說法對也不對:
✔ 正確的是:
- 爬蟲本身是中立技術
- 抓取「公開索引、網站允許的資訊」是合法常態
❌ Lawsnote 的問題在於:
- 從法源抓了受保護內容存到自家資料庫,並用以跟法源競爭同一群客戶.
✅ 法院針對的是「行為」不是「工具」
- 未經同意、系統化、大規模取得受保護內容
- 重製受保護內容,並用於商業販售
📌 簡單說:
🟢 「爬蟲」≠犯罪
🔴「用爬蟲重製受保護內容來賣錢」=可能侵權
🔴 就算以美國著作權法角度,這也可能被認定超過合理使用的範圍.
3️⃣ 刑法359條「無故取得電磁紀錄罪」爭議
Lawsnote主張:
「法院認為爬蟲就可能是刑事犯罪,會讓所有爬蟲開發者都違法。」
✅ 這是誇大或混淆,法院並不是說「所有爬蟲都可能犯罪」。
✅ 法院重點是:
- 未經同意
- 系統化、大規模、抓取特定商業網站內容
- 建立自家資料庫供付費查詢
✅ 台灣刑法第359條針對的行為是:
無故進入他人電腦系統或取得電磁紀錄
📌 正確解釋是:
🟢 正常使用、遵守授權、抓取公共網址 → 不構成犯罪
🔴 繞過限制、大量抓特定受保護內容 → 可能違法
4️⃣ AI訓練使用抓取資料的法律風險
很多人因此擔心:
如果用爬蟲抓資料來「AI訓練」,就沒問題嗎?
✅ 這也不必然安全。
✅ 風險點在於:
1️⃣ 資料來源是否受著作權保護
2️⃣ 取得方式是否合法(有無繞過封鎖、違反條款)
3️⃣ 訓練用途是否屬於合理使用
4️⃣ 模型輸出是否再現受保護內容
5️⃣ 商業化使用會被嚴格審查
✅ 美國 Anthropic案的啟示
背景:Anthropic被指控大規模抓取盜版電子書(Books3、Library Genesis、Pirate Library Mirror)超過700萬本,建立自己的「中央圖書館」來訓練Claude大型語言模型。
✅ 最新美國法院裁定:
- 舊金山聯邦法官William Alsup裁定:
1️⃣Anthropic把作者的書籍內容用來訓練AI模型 → 屬於合理使用
2️⃣因為AI訓練是「高度轉化性」用途,模型最終產出並非取代原著,而是生成新內容
✅ 但同一裁定同時也指出:
- Anthropic將超過700萬本盜版書籍完整下載並保存成自己的「中央圖書館」
1️⃣這個行為本身不屬於合理使用
2️⃣構成未經授權的重製行為 → 侵權
法院已下令12月再審理 → 判定是否及如何賠償
✅ Alsup法官的核心意見是:
「AI訓練本身可以是合理使用,但不能拿盜版書做自己的資料庫。」
5️⃣ 歐盟 AI Act 的更高標準
歐盟AI法規(AI Act)採取的是更嚴格的「前端合規」邏輯。
✅ 對基礎模型開發者要求:
✔ 訓練資料可溯源
✔ 說明取得合法性
✔ 文件化、可審計
✅ 政策目的:
避免AI公司抓取受保護內容,卻主張「轉化合理使用」而免責
📌 歐盟AI Act的精神:
🟢 鼓勵合法授權、開放資料
🟢 要求透明、可審計
🔴 抑制「黑箱式抓取所有資料」
6️⃣ 新創圈主張「要AI法規來保護新創」的矛盾
在Lawsnote案後,新創圈很多人表示:
台灣應該立AI法規「保護新創」,免得新創都被起訴。
✅ 這裡的邏輯問題是:
✔ 真正的「AI法規」國際趨勢 → 是要求開發者合規 ✔ 特別是資料來源的合法性
✅ 如果台灣要「保護」是指:
🟢放寬管制、讓新創可以隨便抓資料
🟢無視網站條款、無視著作權
✅ 這就和國際法規趨勢(例如歐盟AI Act)背道而馳。
✅ 真正能幫助新創的AI法規應該是:
- 清楚定義合理使用範圍
- 提供合法、開放的資料來源
- 降低授權成本
- 幫助新創合法合規,進軍國際市場
7️⃣ 台灣著作權法的「以刑逼和」問題
雖然 lawsnote 這案子侵權成立,但刑責的輕重仍值得檢討:
- 判處 Lawsnote 兩位創辦人分別4年、2年徒刑,是著作權刑責裡相對重的判決
- 判處 Lawsnote 公司連帶賠償1.0545億元,金額計算是否偏高?
✅ 台灣著作權刑事責任長期被批評「以刑逼和」:
- 著作權法第91條門檻很低:「意圖銷售」就能起訴
- 刑事起訴後被告為了避免前科,往往被迫高額和解
- 對小型業者、新創企業影響尤其大
✅ 《著作權法》第88條,侵權損害賠償的計算方法主要有三種:
(一)實際損害計算 👉 原告證明因侵權而遭受的實際損失
損害 = 侵權行為 → 造成我少賣多少、少賺多少。
(二)利益歸屬計算(侵權利得或不當得利) 👉 被告因此所獲得的不法利益
損害 = 被告從侵權行為賺的錢。
這是法源在本案裡主張的概念 → Lawsnote省下整理成本 → 形成自己的商品。
(三)權利金推定 👉 著作權法特別設計的「替代計算法」
損害額 = 一般情況下合理的授權金額
👉法院要避免「過度賠償」 違反比例原則;但也不能讓「侵權比合法便宜」.
👉侵害著作權的賠償金,可用上述三種「實際損害」「侵權利得」「合理授權金」路線來推算;本案法院採法源的講法:「省下的建置成本 = 侵權利益」,這算法是否合理呢?
✅ 本案特別之處:
- Lawsnote 是提供AI法律搜尋工具的新創
- 商業模式確有侵權問題,但也有資料比對、整合其他來源的努力
- 新創圈認為刑事跟民事都判的很重,對新創可能有寒蟬效應.
✅ 其他國家著作權侵權也有刑事責任,但通常門檻較高:
- 🇺🇸 美國:需故意、商業規模、金額門檻
- 🇯🇵 日本、🇰🇷 韓國:針對嚴重、組織化侵權
✅ 最後也提一下另一面的講法,法院提及量刑重的理由:
兩名被告和法源是同行競爭對手,卻把法源花很多時間和錢整理出來的資料,直接抓來自己用,還拿來低價搶客戶,這種行為很不道德。
8️⃣「政府對新創友善 vs. 司法獨立」的矛盾
新創圈大部分都認為法院的判決是打壓新創,甚至覺得因為是新創所以不該判這麼重.
新創是某種特權嗎?
當然不是.
「對新創友善、合法合規」的政策制度是行政和立法該要去努力的;然而司法要維持「依現行法律審判、公平保護權利」的獨立性,不能因為是新創而網開一面(這叫特權)。
① 從新創圈的角度來講,行政跟立法應該制定對新創友善的政策
✔ 政府跟立法的職責是制定政策環境,像是制定對新創友善的法規政策:
- 鼓勵AI和法律科技新創
- 確保合理的資料取得規範
- 設計授權、開放資料、合理使用範圍
- 降低新創合規成本
→ 這些都是行政、立法可以主動設計的「制度環境」。
② 司法的角色:適用現行法律、公平裁判
✔ 法院的職責就是用現行有效的法律,依法公平審判。
✅ 法院不能因為「這家公司是新創」就不適用著作權法,或是輕判甚至免責
✅ 司法獨立的意義就是:法院根據證據和法律,保護被害人權益,維護法律一貫性。
③ 在Lawsnote案裡,為什麼會產生矛盾感?
✅ 矛盾的本質在於:
- 大量用爬蟲抓別人整理好的商業資料庫 → 重製販售 → 構成侵權犯罪 → 判刑、賠償.
- 法院只能依現行法律處理 → 必須保護著作權
- 如果新創圈認為政策要鼓勵 LegalTech 新創的這種行為 → 需要修法或開放授權(而不是給予某家新創公司輕判或免責)
📌 法律沒改,法院很難「自己改成對新創比較友善」而給予例外待遇。
✅ 探討法源的商業模式
從法源的聲明來看,法源強調他們的「法規資料庫」不是靠政府標案才有,而是早在政府開始法規數位化之前,就已經自行蒐集、登打、校對、匯入,建立大量電子資料庫;政府要做自己的資料庫時反而是跟法源「授權取得」資料。
法源強調,他們整理的「法規沿革」「附件」「版本比對」等是長年投入的人工加值成果,不是政府白白給的內容,因此主張這些部分符合著作權法保護「編輯著作」的要件。
這角度是法源自己辯護的說法,當然會強調自己的努力與價值.
其實國外也有像法源這類法律資料庫的商業模式,國際上早期做專利判例數位化的公司 Darts-IP 就是類似模式:
- 在政府部門還沒數位化之前就投入大量成本自行蒐集、建庫。
- 後來政府要建查詢系統時,反而需要買或授權這批資料。
- 商業上也常用「舊資料授權換政府提供的新資料」來做交換。
在這裡,政府標案不是單向「給資料」,而是雙向授權與整理、轉檔服務;而廠商自行蒐集、建庫的著作權還是在廠商這邊。
✔ 要抓到對手侵權來打官司,其實很困難:
像法源這樣商業模式,對手侵權到真正打官司要告成非常不容易;主要是在證據蒐集、法律要件、經濟效益上的高難度.
- 爬蟲爭議裡「授權」「合理使用」「商業化利用」的法律關鍵
- 要證明對手侵權真的「抓走」了資料,需要具體證據:抓到痕跡、浮水印、技術特徵
- 法規條文是公共財,只有「法規沿革、版本附件」經人工整理被認定是「編輯著作」受保護;對手要繞過受保護這部分或是重新轉化都不難。
- 就算告成 → 最多也可能是阻止對方用、收個小錢
因此多數公司選擇用「防爬機制」「合約授權」來管理,而不輕易走到訴訟。
✔ 既然取證如此困難,那麼 Lawsnote 發生了甚麼事?
Lawsnote 負責人在公開場合自己承認所有爬蟲行為、動機,這些原本不好舉證的東西;負責人承認了所有犯罪事實,並且堅稱對手的資料不具有著作權而是公共財-即便有也沒有價值.
無疑是幫對手解決了最困難的部分.
⭐總結:
AI 法規本意不是「保護新創侵權」,而是「讓創新能合規、可持續、能走向國際市場」。
但這樣判罰是否過重的部分還可以再討論.
✔至於現行法律跟政策是否對「這種 LegalTech 把競爭對手資料庫整個搬回去拿來競爭同一群客戶」不夠友善,這確實有討論的空間;但法律沒改-法院不能「自己改成對新創比較友善」的差別待遇.
✔ 其實,這問題也可以用公平交易法的角度來看,著作權法和公平交易法是互補的:
著作權法主要保護「表達」的創作性(例如編輯著作、資料庫的整理與版本控制),確保投入的人力和心力有基本的回收保障; 公平交易法則關注「市場競爭秩序」和「經營成果」的保護,即使資料本身沒著作權,也可以禁止不誠實或搭便車的行為。 從這個角度看,本案爭議的本質也不只是「有沒有著作權保護」而已,而是要不要承認並保護那些長期投入整理和版本控制的成果、要不要讓新的市場參與者可以合理取得並再利用。
至於很多人講到「法規資料是否該算公共財? 司法院等這些政府標案產出的資料著作權歸屬?」對於這些法源也有自己的解釋;然而這些都是另外的問題可以再討論,但也不需要跟這混為一談.