「我只是寫個爬蟲程式抓資料而已,怎麼會犯法?」
這句話,是不少技術人與新創團隊在談數據應用時常掛在嘴邊的台詞。
但2025年7月的一場台灣地方法院判決,讓這句話徹底失效。一家以「法學版 Google」自居的公司——七法公司,因為利用爬蟲工具從「法源資訊公司」的資料庫抓取大量法規沿革內容,被法院判定侵害著作權、觸犯刑法,最重判刑達4年,民事求償更突破新台幣1億元。
https://technews.tw/2025/07/12/lawsnote-vs-law-bank-lawsuit/

爬蟲不再是中立工具,而是可能導致嚴重刑責的利刃。
七法公司怎麼從「法律資料整合平台」成為被告?
七法公司是一家提供法規資料檢索服務的新創企業,自稱為法律工作者提供更快速查詢的介面,廣受部分法律系學生與實務人員使用。
其核心做法,是透過爬蟲程式批次從法源資訊公司網站抓取法規條文與沿革資料,再經由七法自行架構的頁面重新整理呈現。
問題在於,法源公司並不是開放資料平台,其資料內容不只是「原始法律條文」,而是經過編輯整理、標註、比對的「整編法規資料庫」。
法院審理後認為:
- 法源網站所提供的法規沿革資料,具備編輯著作權與創作性。
- 七法公司在未經授權下使用自動化爬蟲大量複製,侵害了該智慧財產權。
- 七法公司持續抓取資料數年,累積下載量龐大,商業營利明確。
因此,不僅民事求償金額突破1億台幣,刑事責任也依《著作權法》第91條、第100條,以及《刑法》妨害電腦使用條款,重判創辦人最高4年徒刑。
為什麼這次會被判這麼重?技術人、企業應注意的三個重點
1. 不是所有網頁資料都可抓,尤其是具創作性與商業價值的內容
許多新創公司、工程師都有個習慣:資料都在網頁上,寫個 script 抓下來再處理就好。但一旦該資料:
- 經過人工編輯、整理、設計分類
- 屬於明顯具有市場價值的資料庫(如法條沿革、專業比對整理)
那麼這些資料的整理本身已構成「編輯著作權」的內容,即使原始法條屬於公領域(Public Domain),該網站的呈現方式與結構依然受保護。
2. 持續性爬蟲,規模龐大,就構成「重複侵權」與「惡意濫用」
法院在七法案中指出,被告持續自動化抓取,不僅繞過系統設限,甚至在法源明確標示「不得擷取、轉載」情況下仍繼續執行,這樣的行為屬於明知違法仍執行,構成加重事實。
也就是說,即便你不是一次抓爆資料,而是每天抓一點,長期累積仍會構成重罪。
3. 抓下來還「公開使用」或「對外提供」,商業牟利目的成立
最關鍵的是,七法不是抓資料自用,而是用這些資料架站、提供搜尋、導入廣告、收費會員。這讓法院認為他們「非單純使用,而是利用資料再製營利」。
若你抓下資料再創品牌、包裝功能、商業使用,那責任就不只是「技術上」的侵犯,而是「商業利用」的侵權行為。
所以,爬蟲現在還能用嗎?
可以。但你必須非常清楚以下幾件事:
- 網站資料屬於開放授權(如政府Open Data)
- 例如政府資料開放平台、Creative Commons 授權、標明可用API等。
- 網站未設限、未標明「禁止抓取」或「禁止商業使用」
- Robots.txt、服務條款、網站頁尾聲明都需檢查清楚。
- 爬蟲使用「不過度干擾」與「不違反技術限制」
- 不攻擊、不重複大量下載、不模擬登入避開控管。
- 資料用途為內部研究、自學用途,非直接公開營利
- 個人使用 vs. 對外發布的風險界線差異極大。
- 必要時主動與資料方簽約授權
- 尤其是企業級應用,請不要冒險。授權協議可以省掉訴訟成本與風險。
爬蟲不是罪,但無視邊界就會變成犯罪
七法公司的案例,提醒所有技術人與資料應用者:
資料在網頁上,不等於你可以自由使用;技術做得到,不代表法律允許你這樣做。
未來的數位工作者、AI開發者、tech產品設計者都應該理解——資料的來源與授權,是最基本的風險管理能力。
別讓「只是抓資料」這句話,變成你下次出庭的自白。