網頁爬蟲的相關法律責任

更新於 發佈於 閱讀時間約 5 分鐘
raw-image











何謂網頁爬蟲

根據維基百科,網路爬蟲(web crawler),也叫網路蜘蛛(spider),是一種用來自動瀏覽全球資訊網的網路機器人,其目的一般為編纂網路索引。

如今,爬蟲已經不再限於建立網路索引。由於爬蟲可自動執行的特性,重複在網路上複製、下載的枯燥工作,也可以交由爬蟲來完成。舉個例子,在〈網頁爬蟲實作-下載司法院書狀範本〉一文中,便是利用爬蟲自動到司法院網頁下載書狀範本。如果沒有用爬蟲,我可能得花上一個星期才能將書狀名稱、下載網址複製下來,然而透過爬蟲,我只用一個晚上就完成了。

使用爬蟲的法律責任

雖然爬蟲是如此好用的工具,但使用時也必須留意相關的法律規範。

著作權

重製

網路上的圖片、文章、音樂、影片、軟體均有著作權,如果使用爬蟲將其全部複製,可能涉及著作權法第3條第1項第5款所稱之重製。重製不一定侵害著作權,但必須符合合理使用的規範。

舉例而言,如果是為了教學、評論、非營利自用的目的而重製,就可以主張合理使用。但如果是轉貼在自己的部落格,那可能就難逃侵權責任。

robot.txt

網路上有流傳一種說法:使用爬蟲必須遵循robot.txt的內容,以免觸犯著作權法。然而這是不正確的說法。

robot.txt,根據維基百科的定義,是一種存放於網站根目錄下的ASCII編碼的文字檔案,用於告訴網路爬蟲此網站中的哪些內容是不應被搜尋引擎取得的,而哪些是可以被爬蟲取得的。

robot.txt充其量只是作者(或是網站管理者)對搜尋引擎爬蟲的授權範圍,換句話說,搜尋引擎根據robot.txt的內容進行爬蟲、快照,基本上不會觸犯著作權法。但如果不是搜尋引擎的爬蟲,而是私人運行的網頁爬蟲 (如自己撰寫的python程式、網路上下載的爬蟲軟體),就無法援引robot.txt作為智慧財產權侵權責任的免責事由

個人資料保護法

有時候網頁上的資訊,涉及個人資料。諸如:姓名、出生年月日、特徵、教育程度、職業、聯絡方式等等。這些個資的蒐集 (爬蟲)、處理 (資料清理)、利用都必須符合個人資料保護法第19條的規範。

個人資料保護法第19條第1項:非公務機關對個人資料之蒐集或處理,除第六條第一項所規定資料外,應有特定目的,並符合下列情形之一者: 一、法律明文規定。 二、與當事人有契約或類似契約之關係,且已採取適當之安全措施。 三、當事人自行公開或其他已合法公開之個人資料。 四、學術研究機構基於公共利益為統計或學術研究而有必要,且資料經過提供者處理後或經蒐集者依其揭露方式無從識別特定之當事人。 五、經當事人同意。 六、為增進公共利益所必要。 七、個人資料取自於一般可得之來源。但當事人對該資料之禁止處理或利用,顯有更值得保護之重大利益者,不在此限。 八、對當事人權益無侵害。

簡而言之,取得這些個資必須是依據法律明文規定、出於與當事人有約定、學術研究必要、公共利益必要,或者資料是取自於一般可得之來源、已合法公開之個人資料。

舉例而言,許多人會在人力資源網站放上自己的履歷,內含姓名、email、學經歷等等個資,如果使用爬蟲蒐集下來,欲進行行銷或其他方式的利用,就必須符合前述個人資料保護法的規定。

同樣的,robot.txt也不能作為個人資料保護法的免責事由

公平交易法

公平交易法的目的,主要是在維護競爭秩序。倘若網頁資料的取得,是他人的心血結晶、有利於在市場上競爭,透過網頁爬蟲將該資料不費吹灰之力全部複製、利用,則有可能違反公平交易法第25條之規定。

公平交易法第25條:除本法另有規定者外,事業亦不得為其他足以影響交易秩序之欺罔或顯失公平之行為。

舉例而言,許多房仲會到競爭對手的網站大量複製售屋資訊,再放置到自己的房仲網站上,營造也有受屋主委託賣屋的假象,進而吸引買家。如此一來,便使得花費大量精力簽下委託售屋契約的房仲平白無故被搭便車。

刑法

網頁爬蟲在蒐集資料時,多半也必須實際進到該網頁,讓網頁載入內容、顯示內容。因此,如果短時間內進行極大量的網頁爬蟲,有可能會癱瘓網站。如此一來,可能會觸犯刑法第360條干擾電腦設備罪。不過以目前市面上主流的網頁主機而言,單純以網頁爬蟲工具要形成類似DDoS的效果,著實也有些困難。

科技始終來自於人性

網頁爬蟲可以幫助我們快速完成重複、枯燥的複製工作,但因為使用網頁爬蟲讓「複製」太過輕易,也容易使得人們忘記資料的取得與整理,其實是一件多麼不容易的事情。

然而網頁爬蟲本身沒有善惡,端看使用者如何運用,這也是所謂的科技中立性。

在使用網頁爬蟲之前,首先確定爬下來的資料,是否符合著作權法的合理使用規範;其次,如果爬下來的資料涉及他人個資,最好是取得同意後再使用;再者,如果爬下來的資料是事業競爭對手的資料,則是能免則免

留言
avatar-img
留言分享你的想法!
avatar-img
GYB的沙龍
40會員
52內容數
正在就讀法律系的你,一定耳聞過司律考試,甚至已經下場考過。我有幸從考海中上岸,希望透過我的經驗,幫助正在迷惘、焦急、或是洩氣的你/妳。專題內容包含是否要參加考試、如何準備考試、面授與函授的優缺點比較等等,幫助你/妳找到最適合自己的解方。
GYB的沙龍的其他內容
2024/04/22
現行的文創法10-1條,無論立法者是有意還無意間選邊站,都有邏輯上的問題。如果用搶票機器人的購買者需要被判刑,那用搶票機器人的黃牛,理論上應該加重刑度,才符合邏輯。如果10-1條的出現,是因黃牛掃票行為而起,邏輯上第3項的適用對象應該改成與第2項相同的「黃牛」,才不會讓人有種開發者衰小坐牢的感覺。
Thumbnail
2024/04/22
現行的文創法10-1條,無論立法者是有意還無意間選邊站,都有邏輯上的問題。如果用搶票機器人的購買者需要被判刑,那用搶票機器人的黃牛,理論上應該加重刑度,才符合邏輯。如果10-1條的出現,是因黃牛掃票行為而起,邏輯上第3項的適用對象應該改成與第2項相同的「黃牛」,才不會讓人有種開發者衰小坐牢的感覺。
Thumbnail
2024/03/26
2023年底,電信界最大的新聞應該是台灣之星和亞太電信走入歷史,台灣的電信商再度回到三雄鼎立的局面。本文將利用過往台灣之星的網路吃到飽門號進行個人伺服器的架設,並探討通訊埠轉發、CGNAT、IPv4、IPv6的問題,並嘗試提出3+1種解決方式。
Thumbnail
2024/03/26
2023年底,電信界最大的新聞應該是台灣之星和亞太電信走入歷史,台灣的電信商再度回到三雄鼎立的局面。本文將利用過往台灣之星的網路吃到飽門號進行個人伺服器的架設,並探討通訊埠轉發、CGNAT、IPv4、IPv6的問題,並嘗試提出3+1種解決方式。
Thumbnail
2024/01/15
相較於英文的軟體授權條款,CC條款簡單的多。但現階段台灣智財法還無法完美的函攝CC條款,這對於強調在地化的CC條款尤為刺痛。希望藉由本文促進大眾對開源模式的了解,早日在智財法中納入相容於copyleft的規範架構。
Thumbnail
2024/01/15
相較於英文的軟體授權條款,CC條款簡單的多。但現階段台灣智財法還無法完美的函攝CC條款,這對於強調在地化的CC條款尤為刺痛。希望藉由本文促進大眾對開源模式的了解,早日在智財法中納入相容於copyleft的規範架構。
Thumbnail
看更多
你可能也想看
Thumbnail
「欸!這是在哪裡買的?求連結 🥺」 誰叫你太有品味,一發就讓大家跟著剁手手? 讓你回購再回購的生活好物,是時候該介紹出場了吧! 「開箱你的美好生活」現正召喚各路好物的開箱使者 🤩
Thumbnail
「欸!這是在哪裡買的?求連結 🥺」 誰叫你太有品味,一發就讓大家跟著剁手手? 讓你回購再回購的生活好物,是時候該介紹出場了吧! 「開箱你的美好生活」現正召喚各路好物的開箱使者 🤩
Thumbnail
學術文化、數位科技,人工智慧發展的進步非常神速。海量的資訊迎面而來、各式各樣的創作成品,透過數位搜索工具,很容易被取得,也容易辨識作品是抄襲或原創。有志氣的寫作者都希望自己的成果越來越傑出,在各自領域出人頭地。抄襲是個罪行,很容易理解,也被絶大多數創作者視為不能觸碰的「天條」。 最
Thumbnail
學術文化、數位科技,人工智慧發展的進步非常神速。海量的資訊迎面而來、各式各樣的創作成品,透過數位搜索工具,很容易被取得,也容易辨識作品是抄襲或原創。有志氣的寫作者都希望自己的成果越來越傑出,在各自領域出人頭地。抄襲是個罪行,很容易理解,也被絶大多數創作者視為不能觸碰的「天條」。 最
Thumbnail
政府、法令是資訊安全的最後防線,本文從政府及法律層面探討網路安全議題,以及資通安全管理法和個資法的重要性。政府擴大進用資安人才,以及執行資通安全管理法、個資法的相關規定,對維護數位平臺安全有著重要作用。除此之外,文章還強調了民眾的資安素養及企業、政府的連手防禦對抗駭客組織及詐騙集團的重要性。
Thumbnail
政府、法令是資訊安全的最後防線,本文從政府及法律層面探討網路安全議題,以及資通安全管理法和個資法的重要性。政府擴大進用資安人才,以及執行資通安全管理法、個資法的相關規定,對維護數位平臺安全有著重要作用。除此之外,文章還強調了民眾的資安素養及企業、政府的連手防禦對抗駭客組織及詐騙集團的重要性。
Thumbnail
📋撰文:高雄律師,王瀚誼律師事務所。 大家好,我們今天要跟大家討論,關於「未經授權使用他人的教學講義可能涉及什麼法律問題」!網路世界資訊發達,民眾常常為圖方便,Ctrl+C再Ctrl+V,輕輕鬆鬆就能複製貼上別人整理的內容,這種常見的行為會不會一不小心觸法呢?
Thumbnail
📋撰文:高雄律師,王瀚誼律師事務所。 大家好,我們今天要跟大家討論,關於「未經授權使用他人的教學講義可能涉及什麼法律問題」!網路世界資訊發達,民眾常常為圖方便,Ctrl+C再Ctrl+V,輕輕鬆鬆就能複製貼上別人整理的內容,這種常見的行為會不會一不小心觸法呢?
Thumbnail
在使用網頁爬蟲之前,首先確定爬下來的資料,是否符合著作權法的合理使用規範;其次,如果爬下來的資料涉及他人個資,最好是取得同意後再使用;再者,如果爬下來的資料是事業競爭對手的資料,則是能免則免。
Thumbnail
在使用網頁爬蟲之前,首先確定爬下來的資料,是否符合著作權法的合理使用規範;其次,如果爬下來的資料涉及他人個資,最好是取得同意後再使用;再者,如果爬下來的資料是事業競爭對手的資料,則是能免則免。
Thumbnail
Facebook 時常改版、限制多,要找到一個適合、好用且簡單上手的工具相當困難,否則就要自己寫龐大的程式爬蟲。本篇介紹簡單好用的 facebook-scraper 套件幫助你順利爬蟲。
Thumbnail
Facebook 時常改版、限制多,要找到一個適合、好用且簡單上手的工具相當困難,否則就要自己寫龐大的程式爬蟲。本篇介紹簡單好用的 facebook-scraper 套件幫助你順利爬蟲。
Thumbnail
介紹 基礎概念 爬蟲其實就是一個自動提取網頁的程式 程式基本運作:Url開始-->分析獲取數據&找到Url-->遞迴下去-->結束 分析獲取數據運作:下載html--解析獲取數據--數據保存 爬蟲可以做哪些事情? 數據為王:抓小說數據,做個內容站; 電影/動漫下載站 抓圖片 政府的公開招標數據,每天
Thumbnail
介紹 基礎概念 爬蟲其實就是一個自動提取網頁的程式 程式基本運作:Url開始-->分析獲取數據&找到Url-->遞迴下去-->結束 分析獲取數據運作:下載html--解析獲取數據--數據保存 爬蟲可以做哪些事情? 數據為王:抓小說數據,做個內容站; 電影/動漫下載站 抓圖片 政府的公開招標數據,每天
Thumbnail
來到本專題的最後一篇,在這篇的內容中,會介紹關於我國資訊系統等的委外辦理。資安漏洞層出不窮,其修補有時力有未逮。可能就需要白帽駭客的力量來協助進行資通安全的管理。這也是唐鳳鼓勵白帽駭客來幫忙做壓力測試的原因.....
Thumbnail
來到本專題的最後一篇,在這篇的內容中,會介紹關於我國資訊系統等的委外辦理。資安漏洞層出不窮,其修補有時力有未逮。可能就需要白帽駭客的力量來協助進行資通安全的管理。這也是唐鳳鼓勵白帽駭客來幫忙做壓力測試的原因.....
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News