本篇筆記著重在將損益表變數套進Sankey Chart三大結構/四大元素(因為前面的抓取資料還沒搞懂,暫時無法分享(>人<;),會分享
Threads上大神分享的練習題,不能只看還要操作。本系列學習筆記會實作大神分享的程式碼,加上自己的註解跟邏輯。
https://www.threads.net/@dn.ape/post/DDbPst7pAId?xmt=AQGzB518N9F6BXd0SA2DruCtASNpfCZ0wp9S1TGd5CiRrQ
留言處原作者提供程式原始碼下載
作者提供的程式碼檔案
分析師結論:FY25Q4 財報 - 本季營收達到$180.55B,YOY增長 4.1%,略高於市場預期 。 - EPS為$0.66 ,略高於預期。 - 電子商務增長 16%,美國的線上銷售額增長 20%,全球電子商務目前佔銷售額的 18% - 全球廣告業務增長 27%,$4.4B - 全球會員業務增長 21%,$3.8B - Walmart Marketplace 業務增長 37%,約45% 的訂單由 WFS 配送 - Capex $23.8B,用於店鋪改造、新店擴編和供應鏈自動化
13F Berkshire Hathaway sent.ipynb
,它爬取網頁波克夏的持股資訊,不依賴其他 Notebook。在這個檔案中,用Pandas DataFrame (df_data
),轉換資料並進行處理。df
這個變數,再用Pandas處理。ipynb
(Jupyter Notebook)是一種 互動式 Python 環境,常用在Google Colab 的環境,檔案會包含
#
--
或 /* ... */
如果要用 VS code 需要安裝 Jupyter Extension
Google Colab Python Notebook 是比較適合的環境,因為可以在網頁上使用,許多套件也已經安裝好了。我選擇用 VS code (可先到官網下載) 呈現,目的是帶著大家一起學會安裝環境。
小技巧:開啟行數顯示,VS Code tips — Enable line numbers in Jupyter notebooks
一開始就跟我說 MissingModuleSource
的錯誤訊息顯示 bs4
(BeautifulSoup) 無法被解析,通常是因為函式庫未安裝或環境未正確設定。以下是解決步驟:
bs4
是否已安裝在 VS Code 終端機 (Terminal) 中執行:
pip show bs4
如果沒有安裝,則執行:
pip install beautifulsoup4
或python -m pip install beautifulsoup4
在 VS Code 的終端機執行:
python -m pip list
看看這些套件是否已經安裝:
beautifulsoup4
簡稱 bs4
bs4
可以用來擷取數據。requests
pandas
requests
爬取的數據。numpy
numpy
提供更快的數據處理,比 pandas
更高效。我自己的版本(需要等個5秒才會跑出來)
如果 python -m pip list
沒有列出這些套件,表示你的 Python 環境可能不對,請嘗試:
python -m pip install beautifulsoup4 requests pandas numpy
如果有缺少的套件,可以手動安裝:(可以用空格一鍵安裝)
pip install beautifulsoup4 requests pandas numpy
pandas
來整理這些數據,可能透過 requests + bs4
來爬取財報數據,再透過 numpy
進行數據轉換,最後用 plotly
或 matplotlib
畫出 Sankey Chart。
但如果你的數據已經在 Excel / CSV,其實 requests
& bs4
不一定要用,但如果你要從網頁爬取財報數據,那這些工具會很有幫助!