【程式碼教學】追蹤自己 Vocus文章每日流量,第二版 1027

閱讀時間約 6 分鐘


剛剛發現之前的程式碼已經不能使用了,我想可能是因為html結構有所改變,另外也想順便處理一下數字如果是含有"K"的數字時,順便轉化一下,時間有限,所以想知道來龍去脈請看下面文章。


【教學】如何用程式碼追蹤Vocus文章每日流量?第一版

【教學】如何用程式碼追蹤Vocus文章每日流量?第一版

https://vocus.cc/article/6530d297fd89780001a7fe33

raw-image


程式碼第二版 1027

線上 colab版本我之後會再修改,以下先給大家我修改後的程式碼。因為時間有限我只改了內容作品管理的版本,另外我將想法寫在結論


內容作品管理版本:


import csv
from bs4 import BeautifulSoup
from datetime import datetime

# 獲取當前日期和時間
current_datetime = datetime.now()
formatted_datetime = current_datetime.strftime("%Y%m%d%H%M")

# 輔助函數:將數字"K"格式的瀏覽量轉換為整數
def parse_views(views_str):
if 'K' in views_str:
return int(float(views_str.replace('K', '')) * 1000)
return int(views_str)

# 讀取HTML文件
with open('row20231027.html', 'r', encoding='utf-8') as file:
html = file.read()

# 創建Beautiful Soup對象
soup = BeautifulSoup(html, 'html.parser')

# 尋找文章卡片元素
articles = soup.find_all('div', class_='articleManageCard__CardWrapper-sc-1i8sb3r-0 eNoxEh')

# 初始化儲存數據的列表
data = []

# 遍歷文章卡片元素
for article in articles:
# 提取標題
title_element = article.find('div', class_='articleManageCard__ArticleTitle-sc-1i8sb3r-6 daceHB')
if title_element:
title = title_element.find('a').text.strip()
link = title_element.find('a')['href']
else:
title = "無標題"
link = "無連結"

# 提取愛心數
like_element = article.find('div', class_='iconCount__IconCountWrapper-sc-otd9xy-0 dWpZNq')
like = like_element.find('span', class_='iconCount__Count-sc-otd9xy-1 ipDLhO').text.strip() if like_element else 0

# 提取瀏覽量
view_element = article.find_all('div', class_='iconCount__IconCountWrapper-sc-otd9xy-0 dWpZNq')
view_span = view_element[-1].find('span', class_='iconCount__Count-sc-otd9xy-1 ipDLhO') if view_element else None
view = parse_views(view_span.text.strip()) if view_span else 0

# 添加建立時間列
created_time = current_datetime.strftime("%Y-%m-%d-%H-%M")

# 將提取的數據添加到列表
data.append([title, link, like, view, created_time])

# 將數據保存到CSV文件,使用帶有當前日期和時間的文件名
csv_filename = f"{formatted_datetime}_articles.csv"
with open(csv_filename, 'w', newline='', encoding='utf-8') as csv_file:
writer = csv.writer(csv_file)

# 添加CSV文件標題行
writer.writerow(["文章標題", "文章連結", "愛心數", "瀏覽量", "建立時間"])

# 寫入數據行
for row in data:
writer.writerow(row)

print(f"數據已保存到 {csv_filename} 文件。")





結論

寫這種程式碼最有趣的地方就在於你需要根據網路架構更新修改你的版本。同時我也在構思要將這個服務改成數位商品的方式,分享給有需要的朋友,如果有興趣的人,或是希望新增什麼樣服務的格友,歡迎大家在下方留言或是透過ig 聯絡我

如果喜歡我的程式碼,也歡迎大家多多贊助我,支持我的創作

我是凱文馬拉穆,我們下次見

我的贊助連結


20.0K會員
404Content count
本專題將探討科技在投資領域的應用。我們將介紹人工智能、大數據分析和自動化投資工具,並解釋如何利用這些技術來優化投資策略和增加投資回報。透過了解智能投資的趨勢和方法,讀者可以更加精準地進行投資決策,提升投資效率和成果。我們也會介紹不同的投資工具和策略,解釋風險與回報的關係,並提供基本的投資原則和技巧。
留言0
查看全部
發表第一個留言支持創作者!
就在台灣時間 10/25 凌晨,蘋果突然發出Scary fast 發表會,而且是 10 月發表會邀請函,並且很仁慈的將在美國時間 10/30 下午 5 點、台灣時間 10/31 早上 8 點舉辦發表會(不用熬夜了) 本來 9 月初彭博社 Mark Gurman說不會有發表會,10月中旬又說會有
你渴望獲得更多知識,但缺乏時間和精力? 伊隆·馬斯克提出了兩個策略,可以幫助你閱讀更多書籍,提升自我。
今天台灣 google趨勢分析第一名,毫無意外就是Ed Sheeran時隔五年再度來台(如果沒有受傷的話),而且這次是在高雄國家體育場開唱。
寫完一篇文章後,你總會好奇我的文章流量到底隨著時間每天到底成長了多少,或是當你看著數據圖表的時候,你很想知道你的每日的總瀏覽量是來自於哪一篇文章。 因為這個原因,我嘗試用程式碼解決。
Photoshop 2024 正式引入AI功能後,我們之前在只能在 Beta上使用的生成擴張還有生成填色,都可以在接下來的 Photoshop 2024 上面使用。
首先想要對於有定期在看本犬文章更新的人,對於近一週無預警的停更至上最高的歉意,因為這也是我想要實驗的一部分。停更這些日子以來還是每天有破百的瀏覽量,這是我始料未及的。也讓我休息一下反思後覺得自己應該要趕快起程了。 接下來會陸續將一些股癌筆記補上,我的素材庫也堆積了很多的題目正在用有限的時間努力
就在台灣時間 10/25 凌晨,蘋果突然發出Scary fast 發表會,而且是 10 月發表會邀請函,並且很仁慈的將在美國時間 10/30 下午 5 點、台灣時間 10/31 早上 8 點舉辦發表會(不用熬夜了) 本來 9 月初彭博社 Mark Gurman說不會有發表會,10月中旬又說會有
你渴望獲得更多知識,但缺乏時間和精力? 伊隆·馬斯克提出了兩個策略,可以幫助你閱讀更多書籍,提升自我。
今天台灣 google趨勢分析第一名,毫無意外就是Ed Sheeran時隔五年再度來台(如果沒有受傷的話),而且這次是在高雄國家體育場開唱。
寫完一篇文章後,你總會好奇我的文章流量到底隨著時間每天到底成長了多少,或是當你看著數據圖表的時候,你很想知道你的每日的總瀏覽量是來自於哪一篇文章。 因為這個原因,我嘗試用程式碼解決。
Photoshop 2024 正式引入AI功能後,我們之前在只能在 Beta上使用的生成擴張還有生成填色,都可以在接下來的 Photoshop 2024 上面使用。
首先想要對於有定期在看本犬文章更新的人,對於近一週無預警的停更至上最高的歉意,因為這也是我想要實驗的一部分。停更這些日子以來還是每天有破百的瀏覽量,這是我始料未及的。也讓我休息一下反思後覺得自己應該要趕快起程了。 接下來會陸續將一些股癌筆記補上,我的素材庫也堆積了很多的題目正在用有限的時間努力
本篇參與的主題策展
ReMarkable推出搭載客製化的Gallery 3面板Color Canvas 3.0的全新產品ReMarkable Paper Pro。此機具備229dpi解析度及20000色全彩效果,為電子紙市場注入新活力。此外,此機竟然放棄Wacom改用主動式手寫筆,此創新變革消費者是否買單?
先前麥克買了在預算及性能方面都十分複合需求的NXTPAPER 11平板,但拿到辦公室使用後便發現因為時不時有簡報需求,主機本身不支援有線視訊輸出實在是非常不方便,因又開始尋找新歡。最終麥克選擇了算是還滿熟悉的品牌小米旗下的小米平板6,以下為麥克這一個月下來的使用心得。
從預計的十月底出貨經過重重波折,Pubu自家開發的10寸彩色閱讀器Pubook Pro終於是送到第一批集資者手中了。究竟這台閱讀器有沒有本事撼動目前的電子紙閱讀器市場?有達到集資時承諾的各項功能嗎?且讓身為首批集資者之一的麥克跟大家談談收到主機後使用數天的感想。
Steam Deck 迎來大改版,最重要的更新就是換成 OLED 螢幕。使用 OLED 螢幕帶來更好看的顏色,大小還小幅提升到 7.4 吋。關係續航力的電池也從 40 瓦小時升級到 50 瓦小時, 3A 大作都可以多玩一小時呢!這麼香的更新,怎麼不給他買下去呢 😄
ReMarkable推出搭載客製化的Gallery 3面板Color Canvas 3.0的全新產品ReMarkable Paper Pro。此機具備229dpi解析度及20000色全彩效果,為電子紙市場注入新活力。此外,此機竟然放棄Wacom改用主動式手寫筆,此創新變革消費者是否買單?
先前麥克買了在預算及性能方面都十分複合需求的NXTPAPER 11平板,但拿到辦公室使用後便發現因為時不時有簡報需求,主機本身不支援有線視訊輸出實在是非常不方便,因又開始尋找新歡。最終麥克選擇了算是還滿熟悉的品牌小米旗下的小米平板6,以下為麥克這一個月下來的使用心得。
從預計的十月底出貨經過重重波折,Pubu自家開發的10寸彩色閱讀器Pubook Pro終於是送到第一批集資者手中了。究竟這台閱讀器有沒有本事撼動目前的電子紙閱讀器市場?有達到集資時承諾的各項功能嗎?且讓身為首批集資者之一的麥克跟大家談談收到主機後使用數天的感想。
Steam Deck 迎來大改版,最重要的更新就是換成 OLED 螢幕。使用 OLED 螢幕帶來更好看的顏色,大小還小幅提升到 7.4 吋。關係續航力的電池也從 40 瓦小時升級到 50 瓦小時, 3A 大作都可以多玩一小時呢!這麼香的更新,怎麼不給他買下去呢 😄
你可能也想看
Thumbnail
1.加權指數與櫃買指數 週五的加權指數在非農就業數據開出來後,雖稍微低於預期,但指數仍向上噴出,在美股開盤後於21500形成一個爆量假突破後急轉直下,就一路收至最低。 台股方面走勢需觀察週一在斷頭潮出現後,週二或週三開始有無買單進場支撐,在沒有明確的反轉訊號形成前,小夥伴盡量不要貿然抄底,或是追空
Thumbnail
重點摘要: 1.9 月降息 2 碼、進一步暗示年內還有 50 bp 降息 2.SEP 上修失業率預期,但快速的降息速率將有助失業率觸頂 3.未來幾個月經濟數據將繼續轉弱,經濟復甦的時點或是 1Q25 季底附近
Thumbnail
近期的「貼文發佈流程 & 版型大更新」功能大家使用了嗎? 新版式整體視覺上「更加凸顯圖片」,為了搭配這次的更新,我們推出首次貼文策展 ❤️ 使用貼文功能並完成這次的指定任務,還有機會獲得富士即可拍,讓你的美好回憶都可以用即可拍珍藏!
Thumbnail
菲律賓遊學地點解析比較文章目錄 菲律賓遊學地點差異簡表解析 宿霧遊學 Cebu 碧瑤遊學 Baguio 克拉克遊學 Clark 巴科羅遊學 Bacolod 怡朗遊學 Iloilo 馬尼拉遊學 Manila 在考慮是否要去菲律賓遊學?還在思考要停留多久時間?這些問題很苦惱嗎? 📷 *宿霧歷史背景
簡易的動能策略(rate of change)概念
Thumbnail
假設,每天的行情在開盤後,可以分為五種,分別是大漲、小漲、盤整、小跌、大跌。然後策略是 : 每日於開盤時的開盤價(OpenD(0))位置,無條件做多,並設好多單停損出場價位,以及尾盤當沖出場還有每天僅只交易一次,那麼長久實施這個當沖策略是會賺錢。
Thumbnail
盤整盤,顧名思義K棒呈現出來的視覺就是短短、小小、乾乾、扁扁,以單一K棒而言,High、Low很接近,或是Open、Close也很接近,尤有甚者,以多隻K棒而言,High與High[1]、Low與Low[1]、...等近期價格,都彼此很糾纏也可視為盤整、波動度壓縮。
金融交易的古老名言 : 掌握波動,創造財富、 預測方向,傾家蕩產、 本多常勝,本少拚勇、 富貴在天、智者常思。 Kaufman的概念也很直覺,甚至可以作為逐筆Tick交易的策略範本,意即累積移動的淨距離與總計的移動距離比值,以此作為波動大小的判斷依據
簡單的均線排列加上一個拉回等待買進的條件,運用平均真實區間作為波動度的衡量依據,並以此做為停利目標、停損目標與條件式損益兩平出場策略
ADX這個指標可以同時衡量波動度與行情方向,也因為內在的出頭落尾設計邏輯可以多方變化(利用創新高、創新低的動能,作為多空力道的判斷依據),長久以來就是模組開發練功的第一步
Thumbnail
#談管教 #管教 #程式碼 #需要更新 電腦需要常常更新程式碼,才能防止錯誤或者當機,其實孩子也需要。 Photo by Markus Spiske on Unsplash 不過更正確地來說,我們更新的是孩子的判斷能力,因為孩子會長大,不能一直用同一個標準,不然就會出問題。然而,現實狀況是,我
Thumbnail
方格子搜尋「豐XQ鑽卡會員」就可以看到所有豐XQ鑽卡文章 點選其中一篇,以鑽卡文章「漲時重勢-均線多頭排列幫你挑強勢股!」為例 。
之前,我的一位下屬曾經詢問我,若之後他在工作上需要研究新技術時,需要寫一些sample project來驗證觀念,那這些sample project是否可開源在他自己的Github或部落格上?
Thumbnail
1.加權指數與櫃買指數 週五的加權指數在非農就業數據開出來後,雖稍微低於預期,但指數仍向上噴出,在美股開盤後於21500形成一個爆量假突破後急轉直下,就一路收至最低。 台股方面走勢需觀察週一在斷頭潮出現後,週二或週三開始有無買單進場支撐,在沒有明確的反轉訊號形成前,小夥伴盡量不要貿然抄底,或是追空
Thumbnail
重點摘要: 1.9 月降息 2 碼、進一步暗示年內還有 50 bp 降息 2.SEP 上修失業率預期,但快速的降息速率將有助失業率觸頂 3.未來幾個月經濟數據將繼續轉弱,經濟復甦的時點或是 1Q25 季底附近
Thumbnail
近期的「貼文發佈流程 & 版型大更新」功能大家使用了嗎? 新版式整體視覺上「更加凸顯圖片」,為了搭配這次的更新,我們推出首次貼文策展 ❤️ 使用貼文功能並完成這次的指定任務,還有機會獲得富士即可拍,讓你的美好回憶都可以用即可拍珍藏!
Thumbnail
菲律賓遊學地點解析比較文章目錄 菲律賓遊學地點差異簡表解析 宿霧遊學 Cebu 碧瑤遊學 Baguio 克拉克遊學 Clark 巴科羅遊學 Bacolod 怡朗遊學 Iloilo 馬尼拉遊學 Manila 在考慮是否要去菲律賓遊學?還在思考要停留多久時間?這些問題很苦惱嗎? 📷 *宿霧歷史背景
簡易的動能策略(rate of change)概念
Thumbnail
假設,每天的行情在開盤後,可以分為五種,分別是大漲、小漲、盤整、小跌、大跌。然後策略是 : 每日於開盤時的開盤價(OpenD(0))位置,無條件做多,並設好多單停損出場價位,以及尾盤當沖出場還有每天僅只交易一次,那麼長久實施這個當沖策略是會賺錢。
Thumbnail
盤整盤,顧名思義K棒呈現出來的視覺就是短短、小小、乾乾、扁扁,以單一K棒而言,High、Low很接近,或是Open、Close也很接近,尤有甚者,以多隻K棒而言,High與High[1]、Low與Low[1]、...等近期價格,都彼此很糾纏也可視為盤整、波動度壓縮。
金融交易的古老名言 : 掌握波動,創造財富、 預測方向,傾家蕩產、 本多常勝,本少拚勇、 富貴在天、智者常思。 Kaufman的概念也很直覺,甚至可以作為逐筆Tick交易的策略範本,意即累積移動的淨距離與總計的移動距離比值,以此作為波動大小的判斷依據
簡單的均線排列加上一個拉回等待買進的條件,運用平均真實區間作為波動度的衡量依據,並以此做為停利目標、停損目標與條件式損益兩平出場策略
ADX這個指標可以同時衡量波動度與行情方向,也因為內在的出頭落尾設計邏輯可以多方變化(利用創新高、創新低的動能,作為多空力道的判斷依據),長久以來就是模組開發練功的第一步
Thumbnail
#談管教 #管教 #程式碼 #需要更新 電腦需要常常更新程式碼,才能防止錯誤或者當機,其實孩子也需要。 Photo by Markus Spiske on Unsplash 不過更正確地來說,我們更新的是孩子的判斷能力,因為孩子會長大,不能一直用同一個標準,不然就會出問題。然而,現實狀況是,我
Thumbnail
方格子搜尋「豐XQ鑽卡會員」就可以看到所有豐XQ鑽卡文章 點選其中一篇,以鑽卡文章「漲時重勢-均線多頭排列幫你挑強勢股!」為例 。
之前,我的一位下屬曾經詢問我,若之後他在工作上需要研究新技術時,需要寫一些sample project來驗證觀念,那這些sample project是否可開源在他自己的Github或部落格上?