什麼是爬蟲？｜程式學習筆記

DAN

發佈於學習新軟體

2025/10/14 更新2025/10/14 發佈閱讀 3 分鐘

紀錄我問AI生成的筆記

🕷️ 一句話定義

爬蟲就是一種「自動幫你上網抓資料」的程式。

💡 比喻理解

想像你是個人類「資料收集員」，每天要做的事情是：

打開瀏覽器
進到一個網站
把你想要的文字、圖片或價格抄下來
存進 Excel

這樣做手動太慢了。

於是你寫一個「爬蟲程式」，讓電腦自動幫你做這些動作。

這樣它就像一隻「小蜘蛛（crawler）」在網站上自動爬來爬去、收集資料。

🧱 爬蟲的基本流程

1️⃣ 發送請求

用 Python、JavaScript 或其他語言發送一個「GET」請求去網站。

import requests
html = requests.get("https://example.com").text

2️⃣ 取得 HTML 原始碼

這就是瀏覽器背後的文字版內容。

3️⃣ 解析資料（Parse）

用工具（例如 BeautifulSoup）找出你想要的部分。

from bs4 import BeautifulSoup
soup = BeautifulSoup(html, "html.parser")
title = soup.find("h1").text

4️⃣ 儲存結果

把抓下來的文字、圖片連結、價格等等存成 .csv、.xlsx 或資料庫。

📦 你能用爬蟲做什麼？

類型應用商品價格自動蒐集 PChome、蝦皮價格變化天氣資料抓中央氣象局、Open-Meteo API新聞摘要定期蒐集新聞標題、日期、連結YouTube / IG抓影片標題、按讚數（需遵守規範）公開資料分析政府開放資料平台（JSON / CSV）

⚠️ 注意事項

🧑‍⚖️ 爬蟲不是駭客行為，但必須遵守網站的 robots.txt 與法律規範。
🚫 不要爬需要登入、私人或有版權的內容。
⚙️ 若網站提供 API，建議使用 API，速度快且合法。

✅ 常見爬蟲工具（以 Python 為主）

工具功能requests發送網頁請求BeautifulSoup解析 HTMLSelenium模擬滑鼠點擊與登入（自動開瀏覽器）Scrapy專業爬蟲框架，適合大量資料抓取

留言

DAN的沙龍

12會員

18內容數

你可能也想看

2024/05/24

2024/05/24

本文介紹了AI助手在數據收集和訓練過程中的工作原理和不斷進步的過程。關注的內容包括從公開的網絡資源、書籍、文章等渠道收集數據，數據的清洗和結構化處理，知識庫的增量更新以及訓練算法和模型的優化。如果大家對AI助手的發展還有任何其他感興趣的話題或建議，歡迎隨時告訴我們，讓我們共同探索，攜手進步。

2024/07/11

2024/07/11

《海妲．蓋柏樂》：女性困境與「永恆少年」的毀滅衝動

5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》，由臺灣劇團「晃晃跨幅町」製作，本文將以從舞台符號、聲音與表演調度切入，討論海妲・蓋柏樂在父權社會結構下的困境，並結合榮格心理學與馮．法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析，理解女人何以走向精神性的操控、毀滅與死亡。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/05

黃郁書的沙龍

《海妲．蓋柏樂》：女性困境與「永恆少年」的毀滅衝動

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/05

JayRay 的沙龍

【資料分析】python資料視覺化基礎操作語法彙整

Python資料視覺化在數據分析中扮演關鍵角色，透過視覺化捕捉數據模式、趨勢和異常，透過Matplotlib等工具創建專業圖表變相對簡單和高效。

#python#Matplotlib#資料分析

2024/08/03

JayRay 的沙龍

【資料分析】python資料視覺化基礎操作語法彙整

Python資料視覺化在數據分析中扮演關鍵角色，透過視覺化捕捉數據模式、趨勢和異常，透過Matplotlib等工具創建專業圖表變相對簡單和高效。

#python#Matplotlib#資料分析

2024/08/03

如何用Python繪製區域圖

2024/06/03

如何用Python繪製區域圖

2024/06/03

柏林劇團《三便士歌劇》：巴里．柯斯基的經典再造，與布萊希特劇場的當代轉向

本文分析導演巴里・柯斯基（Barrie Kosky）如何運用極簡的舞臺配置，將布萊希特（Bertolt Brecht）的「疏離效果」轉化為視覺奇觀與黑色幽默，探討《三便士歌劇》在當代劇場中的新詮釋，並藉由舞臺、燈光、服裝、音樂等多方面，分析該作如何在保留批判核心的同時，觸及觀眾的觀看位置與人性幽微。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/11