【深智書摘】金融資料的定量分析 - Pandas 運算套件

閱讀時間約 2 分鐘
  • 文內如有投資理財相關經驗、知識、資訊等內容,皆為創作者個人分享行為。
  • 有價證券、指數與衍生性商品之數據資料,僅供輔助說明之用,不代表創作者投資決策之推介及建議。
  • 閱讀同時,請審慎思考自身條件及自我決策,並應有為決策負責之事前認知。
  • 方格子希望您能從這些分享內容汲取投資養份,養成獨立思考的能力、判斷、行動,成就最適合您的投資理財模式。

正所謂「套件」如其名,Pandas 運算套件在資料處理領域的受歡迎程度完全可與善於賣萌的大熊貓相媲美。當然,Pandas 的名稱其實來自經濟學術語—面板資料 (panel data)。

眾所皆知,金融領域存在巨量的資料處理與分析,而Pandas 運算套件就是當時就職於AQR Capital Management的韋斯·麥金尼 (Wes McKinney) 為了金融資料的定量分析從2008 年開始開發的,它本質上是在NumPy 陣列結構基礎上建構的,並納入了大量的套件以及標準資料模型。在2009 年底,Pandas 實現了開放原始碼。如今它已經應用於許多領域的資料探勘、篩選、處理、統計和輸出。以下,為Pandas 運算套件對資料以及檔案的應用。
下面以股票為例講解如何計算收益率。如圖1所示為某幾天股價走勢,不考慮分紅,股票日簡單回報率yi 可以透過式(1) 獲得。
式(1)
圖1 股價幾天走勢
利用pandas_datareader 運算套件可以下載股票歷史資料,並繪製如圖2 所示股價走勢圖。沒有安裝這個運算套件的讀者需要提前安裝。
如圖3展示的是基於圖2股價資料計算得到的日簡單回報率。圖4中5 條紅色畫線從上至下分別為:μ + 2σ、μ + σ、μ、μσ 和μ2σ。μ為日簡單回報率平均值,σ 為日簡單回報率均方差。如圖5所示為日簡單回報率分佈長條圖;可以發現回報率展現出類似正態分佈的有趣現象。基於μ 和σ,可以得到日簡單回報率的常態擬合,如圖6所示。圖6長條圖左尾展現出明顯厚尾 (fat tail) 現象。
圖2 股價過去一年走式
圖3 日簡單回報率
圖4 日簡單回報率分佈
圖5 日簡單回報率分佈和常態擬合
周簡單回報率可以透過式(2) 計算獲得。
式(2)
周簡單回報率和日簡單回報率關係為:式(3)
式(3)
如圖6所示為基於圖1股價資料計算得到的周簡單回報率。
圖6 周簡單回報率
本文尚有程式可以用來獲得圖2∼圖6。請詳見《手術刀般精準的FRM - 用Python科學管控財金風險(基礎篇) 》。
本叢書以FRM 為中心介紹實際工作所需的金融風險建模和管理知識,並且將Python 程式設計有機地結合到內容中。就形式而言,本書一大特點是透過豐富多彩的圖表和生動貼切的實例,深入淺出地將煩瑣的金融概念和複雜的計算結果進行了視覺化,能有效地幫助讀者領會重點並提高程式設計水準。更多Python在財經風險的應用,請詳見《手術刀般精準的FRM - 用Python科學管控財金風險(基礎篇) 》
為什麼會看到廣告
avatar-img
9會員
25內容數
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
深智數位的沙龍 的其他內容
最近,RIS因其能夠透過智慧地重構無線傳播環境來增強無線網路的容量和覆蓋範圍的潛力而受到極大關注,被認為是6G通訊網路中一項有前途的技術。在此背景下,廣大研究者和企業對RIS進行了大量的研究,包括實現其可重構性的硬體材料、設定的波束成形技術和資源設定技術等。 智慧超表面基本原理 發展歷史和研究現狀
有此一說:身為軟體開發工程師,你可以沒有Facebook,但不能沒有GitHub。如果Git給予軟體開發工程師版本控制的能力,那麼GitHub則帶領你遨遊開源世界的美麗。 全世界最大的原始碼管理平台與開放原始碼社群 檢視公開軟體套件內程式碼,理解邏輯並正確使用 搜尋方便的套件與相關資源加速軟體開發
  卷積神經網路(Convolutional Neural Networks,CNN),其應用包括影像辨識、自然語言處理(NLP)等領域。若能從其發展至今的脈絡開始了解,必定可以更進一步地理解專案的想法,將該技術掌握得更得心應手。以下就其發展和結構分別詳細說明。 1. LeNet
Kubernetes是什麼? 1. Kubernetes是Google嚴格保密十幾年的秘密武器——Borg的一個開放原始碼版本。 2. Kubernetes是一個開放的開發平台。 3. Kubernetes是一個完備的分散式系統支撐平台。
大部分處理影像的神經網路,例如簡單的神經網路、CNN、物件偵測、語義分割、臉部辨識等,都是以像素為輸入特徵,圖神經網路 (GNN) 則是以圖形理論 (Graph Theory) 為基礎,以向量作為輸入,內含節點 (Node) 及邊 (Edge),如下圖,以圖形表達集團交叉持股的關係及持股比例。
要徹底了解深度學習,必須從數學/統計奠定基礎,從張量運算、偏微分、梯度下降優化求解,最後依據機率統計衡量模的效能指標,包括準確率 (Accuracy)、精確率 (Precision)、召回率 (Recall),乃至於混淆矩陣 (Confusion Matrix)。
最近,RIS因其能夠透過智慧地重構無線傳播環境來增強無線網路的容量和覆蓋範圍的潛力而受到極大關注,被認為是6G通訊網路中一項有前途的技術。在此背景下,廣大研究者和企業對RIS進行了大量的研究,包括實現其可重構性的硬體材料、設定的波束成形技術和資源設定技術等。 智慧超表面基本原理 發展歷史和研究現狀
有此一說:身為軟體開發工程師,你可以沒有Facebook,但不能沒有GitHub。如果Git給予軟體開發工程師版本控制的能力,那麼GitHub則帶領你遨遊開源世界的美麗。 全世界最大的原始碼管理平台與開放原始碼社群 檢視公開軟體套件內程式碼,理解邏輯並正確使用 搜尋方便的套件與相關資源加速軟體開發
  卷積神經網路(Convolutional Neural Networks,CNN),其應用包括影像辨識、自然語言處理(NLP)等領域。若能從其發展至今的脈絡開始了解,必定可以更進一步地理解專案的想法,將該技術掌握得更得心應手。以下就其發展和結構分別詳細說明。 1. LeNet
Kubernetes是什麼? 1. Kubernetes是Google嚴格保密十幾年的秘密武器——Borg的一個開放原始碼版本。 2. Kubernetes是一個開放的開發平台。 3. Kubernetes是一個完備的分散式系統支撐平台。
大部分處理影像的神經網路,例如簡單的神經網路、CNN、物件偵測、語義分割、臉部辨識等,都是以像素為輸入特徵,圖神經網路 (GNN) 則是以圖形理論 (Graph Theory) 為基礎,以向量作為輸入,內含節點 (Node) 及邊 (Edge),如下圖,以圖形表達集團交叉持股的關係及持股比例。
要徹底了解深度學習,必須從數學/統計奠定基礎,從張量運算、偏微分、梯度下降優化求解,最後依據機率統計衡量模的效能指標,包括準確率 (Accuracy)、精確率 (Precision)、召回率 (Recall),乃至於混淆矩陣 (Confusion Matrix)。
你可能也想看
Google News 追蹤
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
pandas是用於資料操縱和分析的Python軟體庫。它建造在 NumPy 基礎上,並為操縱數值表格和時間序列,提供了資料結構和運算操作。 Pandas 的主要資料結構包含 Series 和 DataFrame 物件,由於 Pandas 本身基 Numpy 所以在使用大量資料運算時效能表現也優於原
Thumbnail
精明管家系統是一款專注於投資風險管理的工具。它可以分析投資部位,顯示年化報酬率、風險和夏普指標等關鍵數據。系統每日更新庫存,提供歷史持有數和操作記錄,幫助用戶檢討和優化投資策略。此外,它還管理曝險市值和槓桿倍數,適合希望簡單而高效管理投資風險的人士。
Thumbnail
本研究使用了盤中逐筆成交資料(Tick-by-tick Data)來進行股票價格的預測,並討論了馬可夫鏈模型和擴散核模型在這方面的應用。研究結果表明,大多數股票的未來三秒價格可以在少於22個狀態中找到,顯示了交易價格的低不確定性。此外,研究還發現波動性更大和價格更高的股票更難以準確預測。
Thumbnail
重視籌碼分析 基本面跟技術面需要去研究線圖指標或財報等財務資訊 但籌碼只要花點時間研究或許就能看出端倪 過往刻意選了本身股性比較活潑的個股股票 經過思考之後 從今開始會改變一下分享的個股 會開始帶一些用分點進出判斷多空 即便如此 停損停利的重要性還是要有 不如預期 一定要
Thumbnail
Data Analyst 工作過程中所使用的預估方法,不只用在工作上,也可用於投資
Thumbnail
金融股「進階數據」報告是Hank透過統計的方式,衡量現在的台股市場相對過去,究竟是屬於高或低的位階區間。在本期報告你能看到金融股的統計數據。本次的數據統計以 2024/4/3的股價為基準點,目前統計名單內含有14檔金控股、9檔銀行股。我在報告是透過短中長三種不同週期的視角,搭配標準差與常態分佈的
本文介紹了團隊如何將基本面搭配盤勢規劃,進行有系統的交易。透過上週盤勢覆盤、本週盤勢重點、實戰策略和近期大事件等方面,提供短線交易的相關見解和策略建議,以及後市展望。
Thumbnail
金融股「進階數據」報告是Hank透過統計的方式,衡量現在的台股市場相對過去,究竟是屬於高或低的位階區間。在本期報告你能看到金融股的統計數據。本次的數據統計以 2024/01/19的股價為基準點,目前統計名單內含有14檔金控股、9檔銀行股。我在報告是透過短中長三種不同週期的視角,搭配標準差與常...
Thumbnail
呢喃貓投資短線盤勢分析,將搭配分析近期基本面相關訊息,希望透由此方式提供除價格資訊外更多的 INSIGHT,提高交易期望值。
Thumbnail
前言 呢喃貓投資短線盤勢分析,將搭配分析近期基本面相關訊息,希望透由此方式提供除價格資訊外更多的 INSIGHT,提高交易期望值。 先前團隊看到過有交易者在 LUNA 死亡螺旋時仍瘋狂做多(僅看技術面,完全無視基本面),本篇週報為避免貓友走這樣的冤枉路;將分享團隊如何將基本面搭配盤勢規劃,進行有
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
pandas是用於資料操縱和分析的Python軟體庫。它建造在 NumPy 基礎上,並為操縱數值表格和時間序列,提供了資料結構和運算操作。 Pandas 的主要資料結構包含 Series 和 DataFrame 物件,由於 Pandas 本身基 Numpy 所以在使用大量資料運算時效能表現也優於原
Thumbnail
精明管家系統是一款專注於投資風險管理的工具。它可以分析投資部位,顯示年化報酬率、風險和夏普指標等關鍵數據。系統每日更新庫存,提供歷史持有數和操作記錄,幫助用戶檢討和優化投資策略。此外,它還管理曝險市值和槓桿倍數,適合希望簡單而高效管理投資風險的人士。
Thumbnail
本研究使用了盤中逐筆成交資料(Tick-by-tick Data)來進行股票價格的預測,並討論了馬可夫鏈模型和擴散核模型在這方面的應用。研究結果表明,大多數股票的未來三秒價格可以在少於22個狀態中找到,顯示了交易價格的低不確定性。此外,研究還發現波動性更大和價格更高的股票更難以準確預測。
Thumbnail
重視籌碼分析 基本面跟技術面需要去研究線圖指標或財報等財務資訊 但籌碼只要花點時間研究或許就能看出端倪 過往刻意選了本身股性比較活潑的個股股票 經過思考之後 從今開始會改變一下分享的個股 會開始帶一些用分點進出判斷多空 即便如此 停損停利的重要性還是要有 不如預期 一定要
Thumbnail
Data Analyst 工作過程中所使用的預估方法,不只用在工作上,也可用於投資
Thumbnail
金融股「進階數據」報告是Hank透過統計的方式,衡量現在的台股市場相對過去,究竟是屬於高或低的位階區間。在本期報告你能看到金融股的統計數據。本次的數據統計以 2024/4/3的股價為基準點,目前統計名單內含有14檔金控股、9檔銀行股。我在報告是透過短中長三種不同週期的視角,搭配標準差與常態分佈的
本文介紹了團隊如何將基本面搭配盤勢規劃,進行有系統的交易。透過上週盤勢覆盤、本週盤勢重點、實戰策略和近期大事件等方面,提供短線交易的相關見解和策略建議,以及後市展望。
Thumbnail
金融股「進階數據」報告是Hank透過統計的方式,衡量現在的台股市場相對過去,究竟是屬於高或低的位階區間。在本期報告你能看到金融股的統計數據。本次的數據統計以 2024/01/19的股價為基準點,目前統計名單內含有14檔金控股、9檔銀行股。我在報告是透過短中長三種不同週期的視角,搭配標準差與常...
Thumbnail
呢喃貓投資短線盤勢分析,將搭配分析近期基本面相關訊息,希望透由此方式提供除價格資訊外更多的 INSIGHT,提高交易期望值。
Thumbnail
前言 呢喃貓投資短線盤勢分析,將搭配分析近期基本面相關訊息,希望透由此方式提供除價格資訊外更多的 INSIGHT,提高交易期望值。 先前團隊看到過有交易者在 LUNA 死亡螺旋時仍瘋狂做多(僅看技術面,完全無視基本面),本篇週報為避免貓友走這樣的冤枉路;將分享團隊如何將基本面搭配盤勢規劃,進行有