網頁爬蟲的相關法律責任

2023/02/12 更新2023/02/12 發佈閱讀 5 分鐘

何謂網頁爬蟲

根據維基百科，網路爬蟲（web crawler），也叫網路蜘蛛（spider），是一種用來自動瀏覽全球資訊網的網路機器人，其目的一般為編纂網路索引。

如今，爬蟲已經不再限於建立網路索引。由於爬蟲可自動執行的特性，重複在網路上複製、下載的枯燥工作，也可以交由爬蟲來完成。舉個例子，在〈網頁爬蟲實作-下載司法院書狀範本〉一文中，便是利用爬蟲自動到司法院網頁下載書狀範本。如果沒有用爬蟲，我可能得花上一個星期才能將書狀名稱、下載網址複製下來，然而透過爬蟲，我只用一個晚上就完成了。

使用爬蟲的法律責任

雖然爬蟲是如此好用的工具，但使用時也必須留意相關的法律規範。

著作權

重製

網路上的圖片、文章、音樂、影片、軟體均有著作權，如果使用爬蟲將其全部複製，可能涉及著作權法第3條第1項第5款所稱之重製。重製不一定侵害著作權，但必須符合合理使用的規範。

舉例而言，如果是為了教學、評論、非營利自用的目的而重製，就可以主張合理使用。但如果是轉貼在自己的部落格，那可能就難逃侵權責任。

robot.txt

網路上有流傳一種說法：使用爬蟲必須遵循robot.txt的內容，以免觸犯著作權法。然而這是不正確的說法。

robot.txt，根據維基百科的定義，是一種存放於網站根目錄下的ASCII編碼的文字檔案，用於告訴網路爬蟲此網站中的哪些內容是不應被搜尋引擎取得的，而哪些是可以被爬蟲取得的。

robot.txt充其量只是作者(或是網站管理者)對搜尋引擎爬蟲的授權範圍，換句話說，搜尋引擎根據robot.txt的內容進行爬蟲、快照，基本上不會觸犯著作權法。但如果不是搜尋引擎的爬蟲，而是私人運行的網頁爬蟲 (如自己撰寫的python程式、網路上下載的爬蟲軟體)，就無法援引robot.txt作為智慧財產權侵權責任的免責事由。

個人資料保護法

有時候網頁上的資訊，涉及個人資料。諸如：姓名、出生年月日、特徵、教育程度、職業、聯絡方式等等。這些個資的蒐集 (爬蟲)、處理 (資料清理)、利用都必須符合個人資料保護法第19條的規範。

個人資料保護法第19條第1項：非公務機關對個人資料之蒐集或處理，除第六條第一項所規定資料外，應有特定目的，並符合下列情形之一者：一、法律明文規定。二、與當事人有契約或類似契約之關係，且已採取適當之安全措施。三、當事人自行公開或其他已合法公開之個人資料。四、學術研究機構基於公共利益為統計或學術研究而有必要，且資料經過提供者處理後或經蒐集者依其揭露方式無從識別特定之當事人。五、經當事人同意。六、為增進公共利益所必要。七、個人資料取自於一般可得之來源。但當事人對該資料之禁止處理或利用，顯有更值得保護之重大利益者，不在此限。八、對當事人權益無侵害。

簡而言之，取得這些個資必須是依據法律明文規定、出於與當事人有約定、學術研究必要、公共利益必要，或者資料是取自於一般可得之來源、已合法公開之個人資料。

舉例而言，許多人會在人力資源網站放上自己的履歷，內含姓名、email、學經歷等等個資，如果使用爬蟲蒐集下來，欲進行行銷或其他方式的利用，就必須符合前述個人資料保護法的規定。

同樣的，robot.txt也不能作為個人資料保護法的免責事由。

公平交易法

公平交易法的目的，主要是在維護競爭秩序。倘若網頁資料的取得，是他人的心血結晶、有利於在市場上競爭，透過網頁爬蟲將該資料不費吹灰之力全部複製、利用，則有可能違反公平交易法第25條之規定。

公平交易法第25條：除本法另有規定者外，事業亦不得為其他足以影響交易秩序之欺罔或顯失公平之行為。

舉例而言，許多房仲會到競爭對手的網站大量複製售屋資訊，再放置到自己的房仲網站上，營造也有受屋主委託賣屋的假象，進而吸引買家。如此一來，便使得花費大量精力簽下委託售屋契約的房仲平白無故被搭便車。

刑法

網頁爬蟲在蒐集資料時，多半也必須實際進到該網頁，讓網頁載入內容、顯示內容。因此，如果短時間內進行極大量的網頁爬蟲，有可能會癱瘓網站。如此一來，可能會觸犯刑法第360條干擾電腦設備罪。不過以目前市面上主流的網頁主機而言，單純以網頁爬蟲工具要形成類似DDoS的效果，著實也有些困難。

科技始終來自於人性

網頁爬蟲可以幫助我們快速完成重複、枯燥的複製工作，但因為使用網頁爬蟲讓「複製」太過輕易，也容易使得人們忘記資料的取得與整理，其實是一件多麼不容易的事情。

然而網頁爬蟲本身沒有善惡，端看使用者如何運用，這也是所謂的科技中立性。

在使用網頁爬蟲之前，首先確定爬下來的資料，是否符合著作權法的合理使用規範；其次，如果爬下來的資料涉及他人個資，最好是取得同意後再使用；再者，如果爬下來的資料是事業競爭對手的資料，則是能免則免。

留言

留言分享你的想法！

GYB的沙龍

40會員

52內容數

正在就讀法律系的你，一定耳聞過司律考試，甚至已經下場考過。我有幸從考海中上岸，希望透過我的經驗，幫助正在迷惘、焦急、或是洩氣的你/妳。專題內容包含是否要參加考試、如何準備考試、面授與函授的優缺點比較等等，幫助你/妳找到最適合自己的解方。

GYB的沙龍的其他內容

2024/04/22

黃牛罰錢，寫程式的坐牢？

現行的文創法10-1條，無論立法者是有意還無意間選邊站，都有邏輯上的問題。如果用搶票機器人的購買者需要被判刑，那用搶票機器人的黃牛，理論上應該加重刑度，才符合邏輯。如果10-1條的出現，是因黃牛掃票行為而起，邏輯上第3項的適用對象應該改成與第2項相同的「黃牛」，才不會讓人有種開發者衰小坐牢的感覺。

2024/04/22

黃牛罰錢，寫程式的坐牢？

2024/03/26

使用手機吃到飽網路架設個人伺服器的方法

2023年底，電信界最大的新聞應該是台灣之星和亞太電信走入歷史，台灣的電信商再度回到三雄鼎立的局面。本文將利用過往台灣之星的網路吃到飽門號進行個人伺服器的架設，並探討通訊埠轉發、CGNAT、IPv4、IPv6的問題，並嘗試提出3+1種解決方式。

2024/03/26

使用手機吃到飽網路架設個人伺服器的方法

2024/01/15

開源授權的特殊類型：CC授權

相較於英文的軟體授權條款，CC條款簡單的多。但現階段台灣智財法還無法完美的函攝CC條款，這對於強調在地化的CC條款尤為刺痛。希望藉由本文促進大眾對開源模式的了解，早日在智財法中納入相容於copyleft的規範架構。

2024/01/15

開源授權的特殊類型：CC授權

看更多

你可能也想看

Chloe小窩

手作人必看｜用蝦皮分潤計畫把興趣變新收入渠道

在小小的租屋房間裡，透過蝦皮購物平臺採購各種黏土、模型、美甲材料等創作素材，打造專屬黏土小宇宙的療癒過程。文中分享多個蝦皮挖寶地圖，並推薦蝦皮分潤計畫。

#手作#黏土手作#輕黏土

2025/09/09

Chloe小窩

手作人必看｜用蝦皮分潤計畫把興趣變新收入渠道

#手作#黏土手作#輕黏土

2025/09/09

小蝸慢慢爬

蝦皮分潤計畫-小豬與小蝸的婚姻神隊友

小蝸和小豬因購物習慣不同常起衝突，直到發現蝦皮分潤計畫，讓小豬的購物愛好產生價值，也讓小蝸開始欣賞另一半的興趣。想增加收入或改善伴侶間的購物觀念差異？讓蝦皮分潤計畫成為你們的神隊友吧！

2025/09/09

2025/09/09

學術文化、數位科技，人工智慧發展的進步非常神速。海量的資訊迎面而來、各式各樣的創作成品，透過數位搜索工具，很容易被取得，也容易辨識作品是抄襲或原創。有志氣的寫作者都希望自己的成果越來越傑出，在各自領域出人頭地。抄襲是個罪行，很容易理解，也被絶大多數創作者視為不能觸碰的「天條」。最

2024/01/24

2024/01/24

【網路安全停看聽】打造密不可破的防護網，政府、法令是最後一道防線

政府、法令是資訊安全的最後防線，本文從政府及法律層面探討網路安全議題，以及資通安全管理法和個資法的重要性。政府擴大進用資安人才，以及執行資通安全管理法、個資法的相關規定，對維護數位平臺安全有著重要作用。除此之外，文章還強調了民眾的資安素養及企業、政府的連手防禦對抗駭客組織及詐騙集團的重要性。

#網路安全#個資法#Podcast

2024/01/21

網路安全停看聽-安啦的沙龍

【網路安全停看聽】打造密不可破的防護網，政府、法令是最後一道防線

#網路安全#個資法#Podcast

2024/01/21

王瀚誼律師事務所的沙龍

抄襲命理講義(上)-著作權法所保護的客體為何？

📋撰文：高雄律師，王瀚誼律師事務所。大家好，我們今天要跟大家討論，關於「未經授權使用他人的教學講義可能涉及什麼法律問題」！網路世界資訊發達，民眾常常為圖方便，Ctrl+C再Ctrl+V，輕輕鬆鬆就能複製貼上別人整理的內容，這種常見的行為會不會一不小心觸法呢？

2023/09/07

王瀚誼律師事務所的沙龍

抄襲命理講義(上)-著作權法所保護的客體為何？

2023/09/07

GYB的沙龍

網頁爬蟲的相關法律責任

在使用網頁爬蟲之前，首先確定爬下來的資料，是否符合著作權法的合理使用規範；其次，如果爬下來的資料涉及他人個資，最好是取得同意後再使用；再者，如果爬下來的資料是事業競爭對手的資料，則是能免則免。

2023/02/12

2023/02/12

【爬蟲系列】Facebook 爬蟲：Facebook scraper 套件介紹

Facebook 時常改版、限制多，要找到一個適合、好用且簡單上手的工具相當困難，否則就要自己寫龐大的程式爬蟲。本篇介紹簡單好用的 facebook-scraper 套件幫助你順利爬蟲。

#facebook#scraper#程式學習

2023/01/22

【爬蟲系列】Facebook 爬蟲：Facebook scraper 套件介紹

#facebook#scraper#程式學習

2023/01/22

一代軍師

玩轉C#之【爬蟲】

介紹基礎概念爬蟲其實就是一個自動提取網頁的程式程式基本運作:Url開始-->分析獲取數據&找到Url-->遞迴下去-->結束分析獲取數據運作:下載html--解析獲取數據--數據保存爬蟲可以做哪些事情? 數據為王：抓小說數據，做個內容站；電影/動漫下載站抓圖片政府的公開招標數據，每天

2022/10/10

2022/10/10

7-11與國防部被駭—資訊戰事件的法制思維啟發（下）

來到本專題的最後一篇，在這篇的內容中，會介紹關於我國資訊系統等的委外辦理。資安漏洞層出不窮，其修補有時力有未逮。可能就需要白帽駭客的力量來協助進行資通安全的管理。這也是唐鳳鼓勵白帽駭客來幫忙做壓力測試的原因.....

#資訊法#駭客#資訊安全

2022/08/27

建佑律師＿NoMoreLaw的沙龍

7-11與國防部被駭—資訊戰事件的法制思維啟發（下）

#資訊法#駭客#資訊安全

2022/08/27

christy tsang的沙龍

網站漏洞掃描對企業的重要性

在資訊性的時代，幾乎每個企業都有自己的網站，提供最大價值及免費的資訊吸引受眾及潛在客戶，從而提高曝光率及點擊率，有助將其轉換成銷量。若資訊安全的預防措施不足，容易受到網絡攻擊及內部安全問題。在這情況下更顯得網站漏洞掃描對企業的重要性，下文會為大家一一講解網站漏洞掃描。為什麼企業需要網站漏洞掃描？

#Cybersecuritysolutions #Websitevulnerabilityscan #信息安全

2022/06/09

christy tsang的沙龍

網站漏洞掃描對企業的重要性

#Cybersecuritysolutions #Websitevulnerabilityscan #信息安全

2022/06/09

麥田出版的沙龍

網路攻擊將如何控制我們的國安與日常生活？

許多人對駭客一詞有著負面的印象。但駭客一詞，原本並不具有負面的意思，而是指對事物內部運作原理深入研究、追求技術卓越的人。不論置身於哪個地方、從事何種產業，深入探索系統原理、追求技術卓越的駭客，都是值得尊敬的。

2021/10/07

2021/10/07

資料爬蟲是資料分析的起手式，必須有好的、可用的資料才得以進行高品質的資料科學專案，爬蟲也是資料科學領域開發者的第一項挑戰。但是當你學完爬蟲的技術之後，開始真的跳入爬蟲世界之後會發現有網站其實沒有想像中好爬。當自動

2021/09/12

張維元的沙龍

爬蟲又被擋了怎麼辦？常見的反爬蟲處理策略

2021/09/12

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News