Python 爬蟲 台股ETF 前10大成分股(包含股票代號,權重)

閱讀時間約 2 分鐘
  • 文內如有投資理財相關經驗、知識、資訊等內容,皆為創作者個人分享行為。
  • 有價證券、指數與衍生性商品之數據資料,僅供輔助說明之用,不代表創作者投資決策之推介及建議。
  • 閱讀同時,請審慎思考自身條件及自我決策,並應有為決策負責之事前認知。
  • 方格子希望您能從這些分享內容汲取投資養份,養成獨立思考的能力、判斷、行動,成就最適合您的投資理財模式。
raw-image


import pandas as pd
import requests
from bs4 import BeautifulSoup
import re
from json import loads
#stock_code = "0056"
stock_code = input("stock code:")
soup = BeautifulSoup(requests.get("tw.stock.yahoo.com/quote{}.TW/holding".format(stock_code)).content)
script = soup.find("script",string=re.compile("root.App.main")).text
data = re.search("root.App.main\s+=\s+(\{.*\})", script).group(1)
print(data)

result = re.findall("\[(.*?)\]",data,re.I|re.M)
dict_data = ""
for item in result:
if("ticker" in item and "weighting" in item):
dict_data = item
print(dict_data)

dict_data_mod ='{"holdingDetail":['+ dict_data + ']}'
print(dict_data_mod)
jsonData = dict_data_mod;
text = loads(jsonData)
print(text['holdingDetail'][0]['name'])

new = pd.DataFrame.from_dict(text['holdingDetail'])
print("{} top 10 constituent stock".format(stock_code))
new

0會員
1內容數
留言0
查看全部
發表第一個留言支持創作者!
你可能也想看
創作者要怎麼好好休息 + 避免工作過量?《黑貓創作報#4》午安,最近累不累? 這篇不是虛假的關心。而是《黑貓創作報》發行以來可能最重要的一篇。 是的,我們這篇講怎麼補充能量,也就是怎麼休息。
Thumbnail
avatar
黑貓老師
2024-06-29
python 爬蟲玉山匯率並部署到aws lambda最近開了複委託打算定期定額買美股,主要因為交割戶是設定外幣帳戶交割,先前設置了常用銀行的外幣到價通知,但是美金最近一直逆空高灰,幾乎不會啟動到價通知🥲,只好一直關注銀行即期價格,但因為上班常常會忘記要看一下外幣網銀換匯優惠,故想說練習python之餘,並順便做個爬蟲將資料發送到line群組
Thumbnail
avatar
DDDDD
2023-08-21
Python 爬蟲入門範例:建立簡易抓取網路資料的爬蟲程式網路爬蟲(web crawler),也叫網路蜘蛛(spider) 是一個強大的自動化工具,可以自由瀏覽、擷取訪問網頁的各項資訊,例如:新聞文章、電商商品價格,當專案中需要添加外部數據或進行大量資料收集時,網路爬蟲就是一個非常實用的工具。
Thumbnail
avatar
Karen
2023-07-31
[Python] 爬取台積電股價在這篇教學中,我們將使用 Python 的 requests 和 BeautifulSoup 套件,來爬取台積電股價的最新交易日收盤價。
avatar
Pochi
2023-06-25
【Google Colab Python系列】該如何設計自己的爬蟲來抓取Html資料?上一篇我們已經介紹過Google Colab的基本用法,建議可以先行閱讀「【Google Colab系列】台股分析預備式: Colab平台與Python如何擦出火花?」,進行基本概念與環境的建置再進行下一步會比較容易進行學習。 雖然網路上已經提供非常多的股市資訊,但各個網站可能都零零散散,難免我們得
Thumbnail
avatar
阿Han
2023-06-10
用Python爬取PTT熱門新聞做成文字雲久久沒更新,把這幾天更新在wordpress的文章搬過來囉! 這是篇自己練習爬蟲,並把爬下來的文字內容透過jieba套件分析後產出文字雲的小練習專案
Thumbnail
avatar
DowDow
2022-06-12
PYTHON+LINE BOT 輕鬆打造股市機器人(十三) :爬取個股相關新聞在上一篇教學中,我們學會如從Goodinfo!中將個股的一些最新與基本資訊爬取下來並打印出來,而先前我們也教過如何爬取台股、全球等較大範圍的新聞爬取,而今天我們就打算將範圍縮小,只針對個股的新聞來進行抓取,那我們就開始今天的教學吧!! 匯入套件 爬取YAHOO!股市
Thumbnail
avatar
陳陳
2022-05-07
PYTHON+LINE BOT 輕鬆打造股市機器人(十二) :爬取個股最新資訊在上一篇教學中,我們學會了如何將鉅亨網上的新聞爬取下來,並且顯示在LINE BOT中,而我們今天則來教一下如何查詢個股的一些基本資訊,以及最新的開盤價、成交價等資訊吧!!
Thumbnail
avatar
陳陳
2022-04-23
python 爬蟲財金─恆生指數 成份股與最新權重 Youtube頻道訂閱 免費(Free) 請點擊網址 https://www.youtube.com/channel/UCL-_zTHVc6yrrnSzZChKLjg?sub_confirmation=1 利用jupyter notebook 爬蟲,擷取恆生指數成份股,目前有64檔個股,未來會往1
avatar
弄什麼大數據
2021-12-07
Python3 靜態爬蟲有時候需要抓一些網路上的資料 而靜態網頁的呈現方式就是 html 這篇記錄一下怎麼用 Python3 抓靜態網頁上的文字 (以下部分為網路資料擷取)
Thumbnail
avatar
LifeOfFProgrammer
2019-06-26