【程式碼教學】追蹤自己 Vocus文章每日流量,第二版 1027

更新於 發佈於 閱讀時間約 6 分鐘


剛剛發現之前的程式碼已經不能使用了,我想可能是因為html結構有所改變,另外也想順便處理一下數字如果是含有"K"的數字時,順便轉化一下,時間有限,所以想知道來龍去脈請看下面文章。


【教學】如何用程式碼追蹤Vocus文章每日流量?第一版

【教學】如何用程式碼追蹤Vocus文章每日流量?第一版

https://vocus.cc/article/6530d297fd89780001a7fe33

raw-image


程式碼第二版 1027

線上 colab版本我之後會再修改,以下先給大家我修改後的程式碼。因為時間有限我只改了內容作品管理的版本,另外我將想法寫在結論


內容作品管理版本:


import csv
from bs4 import BeautifulSoup
from datetime import datetime

# 獲取當前日期和時間
current_datetime = datetime.now()
formatted_datetime = current_datetime.strftime("%Y%m%d%H%M")

# 輔助函數:將數字"K"格式的瀏覽量轉換為整數
def parse_views(views_str):
if 'K' in views_str:
return int(float(views_str.replace('K', '')) * 1000)
return int(views_str)

# 讀取HTML文件
with open('row20231027.html', 'r', encoding='utf-8') as file:
html = file.read()

# 創建Beautiful Soup對象
soup = BeautifulSoup(html, 'html.parser')

# 尋找文章卡片元素
articles = soup.find_all('div', class_='articleManageCard__CardWrapper-sc-1i8sb3r-0 eNoxEh')

# 初始化儲存數據的列表
data = []

# 遍歷文章卡片元素
for article in articles:
# 提取標題
title_element = article.find('div', class_='articleManageCard__ArticleTitle-sc-1i8sb3r-6 daceHB')
if title_element:
title = title_element.find('a').text.strip()
link = title_element.find('a')['href']
else:
title = "無標題"
link = "無連結"

# 提取愛心數
like_element = article.find('div', class_='iconCount__IconCountWrapper-sc-otd9xy-0 dWpZNq')
like = like_element.find('span', class_='iconCount__Count-sc-otd9xy-1 ipDLhO').text.strip() if like_element else 0

# 提取瀏覽量
view_element = article.find_all('div', class_='iconCount__IconCountWrapper-sc-otd9xy-0 dWpZNq')
view_span = view_element[-1].find('span', class_='iconCount__Count-sc-otd9xy-1 ipDLhO') if view_element else None
view = parse_views(view_span.text.strip()) if view_span else 0

# 添加建立時間列
created_time = current_datetime.strftime("%Y-%m-%d-%H-%M")

# 將提取的數據添加到列表
data.append([title, link, like, view, created_time])

# 將數據保存到CSV文件,使用帶有當前日期和時間的文件名
csv_filename = f"{formatted_datetime}_articles.csv"
with open(csv_filename, 'w', newline='', encoding='utf-8') as csv_file:
writer = csv.writer(csv_file)

# 添加CSV文件標題行
writer.writerow(["文章標題", "文章連結", "愛心數", "瀏覽量", "建立時間"])

# 寫入數據行
for row in data:
writer.writerow(row)

print(f"數據已保存到 {csv_filename} 文件。")





結論

寫這種程式碼最有趣的地方就在於你需要根據網路架構更新修改你的版本。同時我也在構思要將這個服務改成數位商品的方式,分享給有需要的朋友,如果有興趣的人,或是希望新增什麼樣服務的格友,歡迎大家在下方留言或是透過ig 聯絡我

如果喜歡我的程式碼,也歡迎大家多多贊助我,支持我的創作

我是凱文馬拉穆,我們下次見

我的贊助連結


留言
avatar-img
留言分享你的想法!
【程式碼教學】追蹤自己 Vocus文章每日流量,第三版 1031提及了這篇文章,趕快過去看看吧!
avatar-img
凱文馬拉穆の 雪橇犬星球
36.0K會員
475內容數
本專題將探討科技在投資領域的應用。我們將介紹人工智能、大數據分析和自動化投資工具,並解釋如何利用這些技術來優化投資策略和增加投資回報。透過了解智能投資的趨勢和方法,讀者可以更加精準地進行投資決策,提升投資效率和成果。我們也會介紹不同的投資工具和策略,解釋風險與回報的關係,並提供基本的投資原則和技巧。
2025/04/12
現代人生活步調緊湊,分心的事物太多,難以專注。本文作者分享自身經驗,說明如何打造「無幹擾區間」,透過刻意安排時間和空間,排除幹擾,提升專注力,找回內在平靜。文中提及番茄工作法、學術研究佐證,並提供打造無幹擾區間的實用方法,鼓勵讀者嘗試,找回專注與平靜。
Thumbnail
2025/04/12
現代人生活步調緊湊,分心的事物太多,難以專注。本文作者分享自身經驗,說明如何打造「無幹擾區間」,透過刻意安排時間和空間,排除幹擾,提升專注力,找回內在平靜。文中提及番茄工作法、學術研究佐證,並提供打造無幹擾區間的實用方法,鼓勵讀者嘗試,找回專注與平靜。
Thumbnail
2025/03/24
探討正面與負面情緒的平衡,指出負面情緒並非敵人,而是成長的助力,並提供五個重新理解情緒價值的方法,幫助讀者在生活中找到平衡,避免過度樂觀或沉溺負面情緒。
Thumbnail
2025/03/24
探討正面與負面情緒的平衡,指出負面情緒並非敵人,而是成長的助力,並提供五個重新理解情緒價值的方法,幫助讀者在生活中找到平衡,避免過度樂觀或沉溺負面情緒。
Thumbnail
2025/03/17
本文利用赫茲伯格的雙因素理論,分析傳統辦公室工作、遠距工作和數位遊牧三種工作型態的優劣勢,幫助讀者瞭解何者更適合自身需求,並強調在職涯發展中嘗試不同工作型態的重要性。
Thumbnail
2025/03/17
本文利用赫茲伯格的雙因素理論,分析傳統辦公室工作、遠距工作和數位遊牧三種工作型態的優劣勢,幫助讀者瞭解何者更適合自身需求,並強調在職涯發展中嘗試不同工作型態的重要性。
Thumbnail
看更多
你可能也想看
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
全球科技產業的焦點,AKA 全村的希望 NVIDIA,於五月底正式發布了他們在今年 2025 第一季的財報 (輝達內部財務年度為 2026 Q1,實際日曆期間為今年二到四月),交出了打敗了市場預期的成績單。然而,在銷售持續高速成長的同時,川普政府加大對於中國的晶片管制......
Thumbnail
全球科技產業的焦點,AKA 全村的希望 NVIDIA,於五月底正式發布了他們在今年 2025 第一季的財報 (輝達內部財務年度為 2026 Q1,實際日曆期間為今年二到四月),交出了打敗了市場預期的成績單。然而,在銷售持續高速成長的同時,川普政府加大對於中國的晶片管制......
Thumbnail
重點摘要: 6 月繼續維持基準利率不變,強調維持高利率主因為關稅 點陣圖表現略為鷹派,收斂 2026、2027 年降息預期 SEP 連續 2 季下修 GDP、上修通膨預測值 --- 1.繼續維持利率不變,強調需要維持高利率是因為關稅: 聯準會 (Fed) 召開 6 月利率會議
Thumbnail
重點摘要: 6 月繼續維持基準利率不變,強調維持高利率主因為關稅 點陣圖表現略為鷹派,收斂 2026、2027 年降息預期 SEP 連續 2 季下修 GDP、上修通膨預測值 --- 1.繼續維持利率不變,強調需要維持高利率是因為關稅: 聯準會 (Fed) 召開 6 月利率會議
Thumbnail
不久前,我曾經有寫過一個可以計算出距離自己最後發文時間,已經過了多久的小工具,當時是希望藉著這個數據化呈現,來督促自己持續產出,不過自從完成了之後,我也同時開始思考,該如何讓這個小工具出現在更多、更顯眼的地方呢?
Thumbnail
不久前,我曾經有寫過一個可以計算出距離自己最後發文時間,已經過了多久的小工具,當時是希望藉著這個數據化呈現,來督促自己持續產出,不過自從完成了之後,我也同時開始思考,該如何讓這個小工具出現在更多、更顯眼的地方呢?
Thumbnail
在交易千萬別見樹不見林 中示範如何在同一張圖表上加入不同週期的行情走勢,本篇將對MultiCharts初體驗-函式撰寫、MultiCharts初體驗-訊號撰寫 的程式進行改寫,讓程式可以讀取到多週期的K線資料。 在MC中可以用Data1、Data2、⋯⋯、Data99的指定方式,來存取圖表中的數列
Thumbnail
在交易千萬別見樹不見林 中示範如何在同一張圖表上加入不同週期的行情走勢,本篇將對MultiCharts初體驗-函式撰寫、MultiCharts初體驗-訊號撰寫 的程式進行改寫,讓程式可以讀取到多週期的K線資料。 在MC中可以用Data1、Data2、⋯⋯、Data99的指定方式,來存取圖表中的數列
Thumbnail
前言 Vue 是一個現代開發框架,擁有完尚的生態系,讓我們可以將須多元件客製化,做出組件,並且可重複利用,高擴充性。在開發組件時,每個組件都擁有自己的生命周期,Vue 組件會偵測每個變數值,是否有變,並且更新內容,今天要一個一個了解 Vue 的生命週期,讓大家有更多認識。 Vue 的生命週期
Thumbnail
前言 Vue 是一個現代開發框架,擁有完尚的生態系,讓我們可以將須多元件客製化,做出組件,並且可重複利用,高擴充性。在開發組件時,每個組件都擁有自己的生命周期,Vue 組件會偵測每個變數值,是否有變,並且更新內容,今天要一個一個了解 Vue 的生命週期,讓大家有更多認識。 Vue 的生命週期
Thumbnail
幾天不用,剛剛發現之前的程式碼已經不能使用了,我想可能是因為html結構有所改變,之前的程式碼可以看下面這一篇文章 【程式碼教學】追蹤自己 Vocus文章每日流量,第二版 1027 更新後的程式碼 import csv from bs4 import BeautifulSoup
Thumbnail
幾天不用,剛剛發現之前的程式碼已經不能使用了,我想可能是因為html結構有所改變,之前的程式碼可以看下面這一篇文章 【程式碼教學】追蹤自己 Vocus文章每日流量,第二版 1027 更新後的程式碼 import csv from bs4 import BeautifulSoup
Thumbnail
程式碼第二版 1027 剛剛發現之前的程式碼已經不能使用了,我想可能是因為html結構有所改變,另外也想順便處理一下數字如果是含有"K"的數字時,順便轉化一下,時間有限,所以想知道來龍去脈請看下面文章。 【教學】如何用程式碼追蹤Vocus文章每日流量?第一版 【教學】如何用程式碼追蹤V
Thumbnail
程式碼第二版 1027 剛剛發現之前的程式碼已經不能使用了,我想可能是因為html結構有所改變,另外也想順便處理一下數字如果是含有"K"的數字時,順便轉化一下,時間有限,所以想知道來龍去脈請看下面文章。 【教學】如何用程式碼追蹤Vocus文章每日流量?第一版 【教學】如何用程式碼追蹤V
Thumbnail
函式 隨著程式功能越來越多,所撰寫的程式碼也會越來越龐大,此時要管理複雜的程式並不是很容易的事,此時可以利用函式來控制程式的複雜度。 提醒 本章節中原本有將訊息傳送給 Twitter 平台的範例,我將其修正為使用print()顯示訊息來模擬(為了不將時間花費在申請 Twitter 帳號)。
Thumbnail
函式 隨著程式功能越來越多,所撰寫的程式碼也會越來越龐大,此時要管理複雜的程式並不是很容易的事,此時可以利用函式來控制程式的複雜度。 提醒 本章節中原本有將訊息傳送給 Twitter 平台的範例,我將其修正為使用print()顯示訊息來模擬(為了不將時間花費在申請 Twitter 帳號)。
Thumbnail
寫完一篇文章後,你總會好奇我的文章流量到底隨著時間每天到底成長了多少,或是當你看著數據圖表的時候,你很想知道你的每日的總瀏覽量是來自於哪一篇文章。 因為這個原因,我嘗試用程式碼解決。
Thumbnail
寫完一篇文章後,你總會好奇我的文章流量到底隨著時間每天到底成長了多少,或是當你看著數據圖表的時候,你很想知道你的每日的總瀏覽量是來自於哪一篇文章。 因為這個原因,我嘗試用程式碼解決。
Thumbnail
字串處理 每個程式都是在處理資料,就拿上一章的猜數字遊戲來說,程式處理的資料就是從使用者輸入的數值與亂數產生器所產生的數值做比較,而這章節主要著重於字串這個資料型態的說明。 字串就是一連串的字元。 字串的第一個字為起始位置(Start),從 0 開始。 字串其他位置的字元與起始字元的距離則
Thumbnail
字串處理 每個程式都是在處理資料,就拿上一章的猜數字遊戲來說,程式處理的資料就是從使用者輸入的數值與亂數產生器所產生的數值做比較,而這章節主要著重於字串這個資料型態的說明。 字串就是一連串的字元。 字串的第一個字為起始位置(Start),從 0 開始。 字串其他位置的字元與起始字元的距離則
Thumbnail
不知不覺寫到第七篇了!QUERY 真的有好多好多東西可以說 (ノ>ω<)ノ QUERY 其實還能處理有日期、時間的資料,而且語法也相當容易,和我們之前就看過的聚集函式很像。你如果會了之前的聚集函式,相信這次處理日期和時間也會對你來說很簡單!
Thumbnail
不知不覺寫到第七篇了!QUERY 真的有好多好多東西可以說 (ノ>ω<)ノ QUERY 其實還能處理有日期、時間的資料,而且語法也相當容易,和我們之前就看過的聚集函式很像。你如果會了之前的聚集函式,相信這次處理日期和時間也會對你來說很簡單!
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News