Python 爬蟲 台股ETF 前10大成分股(包含股票代號,權重)

更新於 發佈於 閱讀時間約 2 分鐘
  • 文內如有投資理財相關經驗、知識、資訊等內容,皆為創作者個人分享行為。
  • 有價證券、指數與衍生性商品之數據資料,僅供輔助說明之用,不代表創作者投資決策之推介及建議。
  • 閱讀同時,請審慎思考自身條件及自我決策,並應有為決策負責之事前認知。
  • 方格子希望您能從這些分享內容汲取投資養份,養成獨立思考的能力、判斷、行動,成就最適合您的投資理財模式。
raw-image


import pandas as pd
import requests
from bs4 import BeautifulSoup
import re
from json import loads
#stock_code = "0056"
stock_code = input("stock code:")
soup = BeautifulSoup(requests.get("tw.stock.yahoo.com/quote{}.TW/holding".format(stock_code)).content)
script = soup.find("script",string=re.compile("root.App.main")).text
data = re.search("root.App.main\s+=\s+(\{.*\})", script).group(1)
print(data)

result = re.findall("\[(.*?)\]",data,re.I|re.M)
dict_data = ""
for item in result:
if("ticker" in item and "weighting" in item):
dict_data = item
print(dict_data)

dict_data_mod ='{"holdingDetail":['+ dict_data + ']}'
print(dict_data_mod)
jsonData = dict_data_mod;
text = loads(jsonData)
print(text['holdingDetail'][0]['name'])

new = pd.DataFrame.from_dict(text['holdingDetail'])
print("{} top 10 constituent stock".format(stock_code))
new

avatar-img
0會員
1內容數
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
你可能也想看
Google News 追蹤
Thumbnail
在創作的路上真的很多人問我說 到底要怎麼做出符合自己期待 但又可以表現得很有美感的作品?🥹 這個問題真的應該是每個創作者都一直在學習的課題吧!
提問的內容越是清晰,強者、聰明人越能在短時間內做判斷、給出精準的建議,他們會對你產生「好印象」,認定你是「積極」的人,有機會、好人脈會不自覺地想引薦給你
本篇我們會繼續討論從Part 1 撈取的 df_878 中提取股票代碼,並使用先前Part 2 定義的 get_info_yfinance 函式來獲取 Yahoo Finance 上的財務資料,接著將這些資料貼回 df_878 的相應欄位中。
Thumbnail
在前一篇 Part 1中,我們成功地將國泰永續高股息ETF (代號00878)的持倉內容(股名、股數)撈出,本篇會介紹如何定義函式來撈取相關盈餘、股價等資訊,輸入股票代碼後回傳預估EPS。
在此篇中,我們來拿實務的例子作實戰練習,我們會討論如何在Google Colab的環境下,撈取所有台美股的股票代碼,並獲取相關細節,最後將獲取的資訊存取於SQLite資料庫中。
Thumbnail
對於剛接觸Python程式的使用者來說,要一口氣學會爬蟲可能相對困難,但若想即時且輕鬆獲得台股相關數據,你可以利用證交所所提供的API進行數據蒐集。只需要簡單幾行程式碼,就能輕鬆抓到台股上千支股票的每日資訊,是不是棒呆了!!
Thumbnail
我常常在分享ETF相關的投資,對於不敢投資股票,或想投資但不知道從哪裡開始的人,ETF算是比較容易理解,也較容易被接受的。ETF雖然是近幾年台股的熱門話題,但卻無法滿足所有投資人。 不少具有一定資歷的投資人,對於ETF的成分股未必全然滿意,總會覺得某幾檔股票根本不應該被納入來拖累績效,
Thumbnail
⭐夥伴們請記得追蹤+開啟通知,才不會錯過收到老牛的最新訊息哦!⭐ 從申購到上市就話題不斷的00940 在週五時換股名單正式揭曉! 老牛也火速整理換股名單 以及老牛如何看00940來跟各位夥伴分享~ . 提醒夥伴們,別忘了「高股息ETF便宜價監控表」已經完成升級囉!喜歡高股息ETF的夥伴,
Thumbnail
好久沒看的陸股ETF,不知一路向下的趨勢,跌到哪裡去了…,哇!007…
Thumbnail
流入ETF的資金確實讓人無法忽視,如果這些資金湧向特定股票確實會對這股價產生一定程度的拉抬效果。 因此我們就可以使用FindBillion這個網站來檢視個股成為了那些ETF的成分股? 又占了這些ETF規模多少百分比
Thumbnail
•A、採樣母體:所有上市股票 •B、選股邏輯: •a、流動性檢驗 •(a)、刪除在最近  1 年日平均交易金額排序最小 20%的股票,日平均交易金額以市場有交易之日數計算。 •(b)、刪除最近 3 個月平均成交量低於 10,000 交易單位之股票。 •B、選取符合財務指標與股利發放指標
Thumbnail
在創作的路上真的很多人問我說 到底要怎麼做出符合自己期待 但又可以表現得很有美感的作品?🥹 這個問題真的應該是每個創作者都一直在學習的課題吧!
提問的內容越是清晰,強者、聰明人越能在短時間內做判斷、給出精準的建議,他們會對你產生「好印象」,認定你是「積極」的人,有機會、好人脈會不自覺地想引薦給你
本篇我們會繼續討論從Part 1 撈取的 df_878 中提取股票代碼,並使用先前Part 2 定義的 get_info_yfinance 函式來獲取 Yahoo Finance 上的財務資料,接著將這些資料貼回 df_878 的相應欄位中。
Thumbnail
在前一篇 Part 1中,我們成功地將國泰永續高股息ETF (代號00878)的持倉內容(股名、股數)撈出,本篇會介紹如何定義函式來撈取相關盈餘、股價等資訊,輸入股票代碼後回傳預估EPS。
在此篇中,我們來拿實務的例子作實戰練習,我們會討論如何在Google Colab的環境下,撈取所有台美股的股票代碼,並獲取相關細節,最後將獲取的資訊存取於SQLite資料庫中。
Thumbnail
對於剛接觸Python程式的使用者來說,要一口氣學會爬蟲可能相對困難,但若想即時且輕鬆獲得台股相關數據,你可以利用證交所所提供的API進行數據蒐集。只需要簡單幾行程式碼,就能輕鬆抓到台股上千支股票的每日資訊,是不是棒呆了!!
Thumbnail
我常常在分享ETF相關的投資,對於不敢投資股票,或想投資但不知道從哪裡開始的人,ETF算是比較容易理解,也較容易被接受的。ETF雖然是近幾年台股的熱門話題,但卻無法滿足所有投資人。 不少具有一定資歷的投資人,對於ETF的成分股未必全然滿意,總會覺得某幾檔股票根本不應該被納入來拖累績效,
Thumbnail
⭐夥伴們請記得追蹤+開啟通知,才不會錯過收到老牛的最新訊息哦!⭐ 從申購到上市就話題不斷的00940 在週五時換股名單正式揭曉! 老牛也火速整理換股名單 以及老牛如何看00940來跟各位夥伴分享~ . 提醒夥伴們,別忘了「高股息ETF便宜價監控表」已經完成升級囉!喜歡高股息ETF的夥伴,
Thumbnail
好久沒看的陸股ETF,不知一路向下的趨勢,跌到哪裡去了…,哇!007…
Thumbnail
流入ETF的資金確實讓人無法忽視,如果這些資金湧向特定股票確實會對這股價產生一定程度的拉抬效果。 因此我們就可以使用FindBillion這個網站來檢視個股成為了那些ETF的成分股? 又占了這些ETF規模多少百分比
Thumbnail
•A、採樣母體:所有上市股票 •B、選股邏輯: •a、流動性檢驗 •(a)、刪除在最近  1 年日平均交易金額排序最小 20%的股票,日平均交易金額以市場有交易之日數計算。 •(b)、刪除最近 3 個月平均成交量低於 10,000 交易單位之股票。 •B、選取符合財務指標與股利發放指標