技術筆記-玩一玩 scipy 的最佳化方法

閱讀時間約 17 分鐘

前言

「最佳化」是很酷的觀念,因為現實世界中許多問題,並沒有嚴謹一致的公式解,但可以利用計算機高速運算能力,透過巧妙的演算法,迭代式反覆逼近最佳解,應用領域非常廣。若能多瞭解一點原理,一定可以提昇解決問題的能力。今天從網路上發現一堂手把手的教學課程,就來演練一下整個過程。期望徹底了解之後,後面可以有些延伸應用。

課程連結在此:https://youtu.be/9GA2WlYFeBU?si=0oEjPXGlrk1VrBDm

感謝專業講師 Ryan O'Connell, CFA, FRM 的分享。


課程演練

問題描述

對於一籃子的資產種類,如何調整各種類所佔的比例 (投資權重),使報酬-風險比 (sharpe ratio) 最大。


資料準備

  • 從 yahoo finance 取得資料,只取一個欄位「調整後收盤價」,存在一個 dataFrame
import yfinance as yf
import pandas as pd
from datetime import datetime, timedelta
import numpy as np
from scipy.optimize import minimize
import matplotlib.pyplot as plt
import seaborn as sns

# 定義一籃子股票 (台積電,聯發科,聯詠,瑞昱,王品,中美晶,台達電)
tickers = ['2330.TW', '2454.TW', '3034.TW', '2379.TW', '2727.TW', '5483.TWO', '2308.TW']

# 設定七年的期間
end_date = datetime.today()
start_date = end_date - timedelta(days = 7*365)

adj_close_df = pd.DataFrame()
for ticker in tickers:
data = yf.download(ticker, start = start_date, end = end_date)
adj_close_df[ticker] = data['Adj Close']
adj_close_df
raw-image


初步分析

從收盤價,計算每日報酬率,記得去掉空資料,以免後續計算錯誤。

log_returns = np.log(adj_close_df / adj_close_df.shift(1))
log_returns = log_returns.dropna()
log_returns
raw-image

有了每日報酬,已經可以得到各資產的歷史表現,以年化指標方式表達。

log_returns.mean()*252
----------------------
2330.TW 0.243656
2454.TW 0.253070
3034.TW 0.291873
2379.TW 0.252808
2727.TW 0.123987
5483.TWO 0.142502
2308.TW 0.182675
dtype: float64

log_returns.std() * np.sqrt(252)
--------------------------------
2330.TW 0.275972
2454.TW 0.378044
3034.TW 0.374934
2379.TW 0.367530
2727.TW 0.354785
5483.TWO 0.420420
2308.TW 0.298477
dtype: float64

接下來計算各標的間的關聯性,以「共變異矩陣」方式表達。

cov_matrix = log_returns.cov()*252
cov_matrix
raw-image


函式準備

# 計算 portfolio 的年化報酬    
def expected_return (weights, log_returns):
return np.sum(log_returns.mean()*weights) * 252

# 計算 portfolio 的標準差,也就是 volatility,或稱波動性
# 重要!!
def standard_deviation (weights, cov_matrix):
variance = weights.T @ cov_matrix @ weights
return np.sqrt(variance)

# 計算 portfolio 的 shapre ratio
def sharpe_ratio (weights, log_returns, cov_matrix, risk_free_rate):
return (expected_return(weights, log_returns) - risk_free_rate) /
standard_deviation(weights, cov_matrix)

# 最佳化的目標函數 (最大化 sharpe,就是最小化 負sharpe)
def neg_sharpe_ratio(weights, log_returns, cov_matrix, risk_free_rate):
return - sharpe_ratio(weights, log_returns, cov_matrix, risk_free_rate)

參數準備

# 執行最佳化時,所需要的重要參數
# 權重加總,必須 = 1
constraints = {'type': 'eq', 'fun': lambda weights: np.sum(weights) - 1}
constraints
-----------
{'type': 'eq', 'fun': <function __main__.<lambda>(weights)>}


# 所有權重,都限制在 00.5 之間,也就是不准單一標的,佔比超過五成
bounds = [(0, 0.5) for _ in range(len(tickers))]
bounds
------
[(0, 0.5), (0, 0.5), (0, 0.5), (0, 0.5), (0, 0.5), (0, 0.5), (0, 0.5)]

risk_free_rate = 0 # 假設忽略無風險利率

# 權重初始值
initial_weights = np.array([1/len(tickers)] * len(tickers))
initial_weights
---------------
array([0.14285714, 0.14285714, 0.14285714, 0.14285714, 0.14285714,
0.14285714, 0.14285714])

執行最佳化

# 最關鍵的一步,scipy 套件提供 minimize(),未提供 maximize() 
optimized_results_sharpe = minimize(neg_sharp_ratio, initial_weights,
args=(log_returns, cov_matrix, risk_free_rate), method='SLSQP',
constraints = constraints, bounds = bounds, options = {'disp': True})
--------------------------------------------------------------------------
Optimization terminated successfully (Exit mode 0)
Current function value: -0.9342487059203365
Iterations: 5
Function evaluations: 40
Gradient evaluations: 5

為了顯示結果,先準備一個函式,讓結果顯示在一張圖表裡:

def show_result(result):
optimal_weights = result.x

optimal_portfolio_return = expected_return(optimal_weights, log_returns)
optimal_portfolio_volatility =
standard_deviation(optimal_weights, cov_matrix)
optimal_sharpe_ratio =
sharpe_ratio(optimal_weights, log_returns, cov_matrix, risk_free_rate)

sns.set_theme(style='whitegrid')
sns.set_color_codes('pastel')
f, ax = plt.subplots(figsize=(7, 5))
title1 = f'Return {optimal_portfolio_return: .4f}'
title2 = f'with Volatility {optimal_portfolio_volatility: .4f}'
title3 = f'and sharpe {optimal_sharpe_ratio: .2f}'
ax.set_title(f'{title1} {title2} {title3}')
sns.barplot(x='weight', y='ticker',
data=pd.DataFrame({'ticker': tickers, 'weight': optimal_weights}),
label='weight', color='b')


raw-image

以上已經完整掌握所有定義,設定和計算流程。


檢討與變形

最小化波動

以上過程最重要的基本邏輯就是最大化 sharpe,就是報酬 / 波動,但用以過的歷史資料的平均報酬,當作面對未來績效的期望值估計量,明顯存在著大量例外。但本來預測未來就是困難的事,目前也沒有更好的作法,就算專業機構也只能將就使用。但個人研究無需包袱纏身,就大膽來做一個變形,就是「忽略報酬率」!只求「最小化波動」。計算 portfolio 標準差的函式已經存在,就把它直接當成目標函數,執行最佳化作業:

optimized_results_volatility = minimize(standard_deviation, initial_weights, 
args=(cov_matrix), method='SLSQP', constraints = constraints,
bounds = bounds, options = {'disp': True})
--------------------------------------------
Optimization terminated successfully (Exit mode 0)
Current function value: 0.2238746037968142
Iterations: 8
Function evaluations: 64
Gradient evaluations: 8

得到結果如下:

raw-image

雖然 sharpe 降至 0.91,但波動從 24% 降至 22%,不錯,這就是我所要的。歷史波動對未來的預測力,我相信是很有參考價值的,比用單純算術平均的報酬去預測未來有用多了。當波動降到很低,我們就可以審慎的逐步擴大槓桿倍數了。槓桿不是洪水猛獸,要提升絕對績效,這是一定要的!


納入空頭部位

為了更近一步降低波動,「做空」就是必要之惡了,因為再怎樣「長期向上」的市場,也免不了無法預測的「中級回調」!屆時如果部位只有 long-only,免不了大幅縮水,痛苦程度不見得扛得住。簡言之還是降低波動的概念。所以需要改一下 constraint and bounds:

# 允許權重為負值,代表做空,而絕對數字依然一樣,代表整體曝險市值的比例。
bounds = [(-0.6, 0.6) for _ in range(len(tickers))]
constraints = {'type': 'eq', 'fun': lambda weights: np.sum(abs(weights)) - 1}

optimized_results_volatility_long_short =
minimize(standard_deviation, initial_weights, args=(cov_matrix),
method='SLSQP', constraints = constraints, bounds = bounds,
options = {'disp': True})

執行結果與上一次相同,似乎此演算法對 initial weight 的影響很大!怎麼跑都還是維持在正直,看來選股難,選空方標的更難。試著加上「大盤指數」看看,重新抓取資料。此時因為未考慮報酬率,所以除權息影響也就甚微了。同時特別指定此標的的 initial weight 為負值,也就是用做空指數來平衡多頭風險:

# 重新指定 ticker 集合,重新執行抓取資料程序
tickers = ['^TWII', '2330.TW', '2454.TW', '3034.TW', '2379.TW', '2727.TW',
'5483.TWO', '2308.TW']

# 指定初值時,特別把第一個元素變號
initial_weights = np.array([1/len(tickers)] * len(tickers))
initial_weights[0] = - initial_weights[0]

重新執行最佳化,得到很棒棒的「超低風險」(0.03) 的投資組合:

raw-image

此結果表示,大約配置 50% more 的指數空頭部位,可充分抵銷投資組合的風險。雖然報酬率也被犧牲了,但「歷史績效永遠不等於未來績效」,而我相信「歷史風險大約等於未來風險」。 雖然全球經濟長期向上的事實還是值得相信的,但中期回檔還是很痛苦的,例子不遠,2022 就經歷過了,所以我偏向經常性的 Long-short 配置,在 portfolio 穩定的前提下,加大槓桿與內部波動共舞。


大致完成一回合的探索過程,透過變化問題定義,限制條件,最佳化函數等等,相信會找到新的應用,趣味也將持續。


Newman 2024/11/6

導覽頁:紐曼的技術筆記-索引







11會員
96內容數
漫步,悠閒自在的隨意行走!是行為,是態度,也是一種境界。
留言0
查看全部
發表第一個留言支持創作者!
newman的沙龍 的其他內容
現有的家是 azure,功能多又有免費額度,算是堪用,只是因為雲端產業蓬勃發展,想體驗一下新東西,所以這次來玩玩新東西 fly.io。從開啟以下賞心悅目的官網,第一次接觸到成功佈署上線,大概半小時就搞定了,體驗不錯,以下稍做紀錄。
打開 jupyter notebook 寫一段 python 程式,可以完成五花八門的工作,這是玩程式最簡便的方式,其中可以獲得很多快樂,在現今這種資訊發達的時代,幾乎沒有門檻,只要願意,人人可享用。 下一步,希望程式可以隨時待命聽我吩咐,不想每次都要開電腦,啟動開發環境,只為完成一個重複性高
查景點,美食,導航,這些功能已經深深融入我們的生活了,背後著要的技術支柱就是科技巨頭所提供的龐大全球地圖資料庫,和隨身手機上的 GPS 定位功能,這是 App 的強項,非玩不可。 需求情境: 在陌生的城市探索,最常用到的地圖功能是什麼?找星巴克是我的第一名,第二是享受更多功能的便利商店,再其次就
需求情境: 為了讓多人使用 App,必須有驗證程序,以識別特定使用者,存取各自擁有的資源。 解決方案: 引用 google 所提供的雲端服務平台 Firebase,其中有多種驗證功能可選用。基於個人對 google 的偏愛,決定先採用 google signin 的方法,實作 login lo
需求情境: 一般的看盤軟體,雖然都能針對一籃子自選股票,列出其即時行情和當天漲幅,但若要看「五日漲幅」呢?那就少見了,但這對我很重要。因為小部位的波段性價差交易是個好策略,這時候若能排序好一整排看下來,可以節省大量點來點去的成本,很有價值,所以就來自己刻。 解決方案: 從大處著眼,UI 最外層
需求情境: 在設計畫面時,資料來源是後台的 api,每一次畫面細節的修修改改,都會觸發 Xcode Preview 程序,導致不斷呼叫後台。此時若資料結構和大小都具有一定規模,就會導致效率低落,不斷等待,且消耗伺服器資源甚鉅。 解決方案: 將後台傳回的資料以檔案形式暫存在本地端,每次 pr
現有的家是 azure,功能多又有免費額度,算是堪用,只是因為雲端產業蓬勃發展,想體驗一下新東西,所以這次來玩玩新東西 fly.io。從開啟以下賞心悅目的官網,第一次接觸到成功佈署上線,大概半小時就搞定了,體驗不錯,以下稍做紀錄。
打開 jupyter notebook 寫一段 python 程式,可以完成五花八門的工作,這是玩程式最簡便的方式,其中可以獲得很多快樂,在現今這種資訊發達的時代,幾乎沒有門檻,只要願意,人人可享用。 下一步,希望程式可以隨時待命聽我吩咐,不想每次都要開電腦,啟動開發環境,只為完成一個重複性高
查景點,美食,導航,這些功能已經深深融入我們的生活了,背後著要的技術支柱就是科技巨頭所提供的龐大全球地圖資料庫,和隨身手機上的 GPS 定位功能,這是 App 的強項,非玩不可。 需求情境: 在陌生的城市探索,最常用到的地圖功能是什麼?找星巴克是我的第一名,第二是享受更多功能的便利商店,再其次就
需求情境: 為了讓多人使用 App,必須有驗證程序,以識別特定使用者,存取各自擁有的資源。 解決方案: 引用 google 所提供的雲端服務平台 Firebase,其中有多種驗證功能可選用。基於個人對 google 的偏愛,決定先採用 google signin 的方法,實作 login lo
需求情境: 一般的看盤軟體,雖然都能針對一籃子自選股票,列出其即時行情和當天漲幅,但若要看「五日漲幅」呢?那就少見了,但這對我很重要。因為小部位的波段性價差交易是個好策略,這時候若能排序好一整排看下來,可以節省大量點來點去的成本,很有價值,所以就來自己刻。 解決方案: 從大處著眼,UI 最外層
需求情境: 在設計畫面時,資料來源是後台的 api,每一次畫面細節的修修改改,都會觸發 Xcode Preview 程序,導致不斷呼叫後台。此時若資料結構和大小都具有一定規模,就會導致效率低落,不斷等待,且消耗伺服器資源甚鉅。 解決方案: 將後台傳回的資料以檔案形式暫存在本地端,每次 pr
你可能也想看
Google News 追蹤
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
美國總統大選只剩下三天, 我們觀察一整週民調與金融市場的變化(包含賭局), 到本週五下午3:00前為止, 誰是美國總統幾乎大概可以猜到60-70%的機率, 本篇文章就是以大選結局為主軸來討論近期甚至到未來四年美股可能的改變
Thumbnail
Faker昨天真的太扯了,中國主播王多多點評的話更是精妙,分享給各位 王多多的點評 「Faker是我們的處境,他是LPL永遠繞不開的一個人和話題,所以我們特別渴望在決賽跟他相遇,去直面我們的處境。 我們曾經稱他為最高的山,最長的河,以為山海就是盡頭,可是Faker用他28歲的年齡...
Thumbnail
本文提供了一個關於模擬法演算法的問題,介紹了操作指令的格式及其解析。透過程式碼模擬每條指令,找出回到根目錄所需的操作次數。本文詳細說明瞭模擬法的複雜度分析,能夠幫助讀者更好地理解這個問題。
前言 在閱讀《強化式學習:打造最強 AlphaZero 通用演算法》時,對一些看似基本,但是重要且會影響到之後實作的項目概念有點疑惑,覺得應該查清楚,所以搞懂後記錄下來,寫下這篇文章(應該說是筆記?)。 正文 下面這段程式碼: model = Sequential() model.add
Thumbnail
解決電腦上遇到的問題、證明正確性、探討效率 並且很著重溝通,說服別人你做的事是正確且有效率的。 內容: 計算模型、資料結構介紹、演算法介紹、時間複雜度介紹。
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
美國總統大選只剩下三天, 我們觀察一整週民調與金融市場的變化(包含賭局), 到本週五下午3:00前為止, 誰是美國總統幾乎大概可以猜到60-70%的機率, 本篇文章就是以大選結局為主軸來討論近期甚至到未來四年美股可能的改變
Thumbnail
Faker昨天真的太扯了,中國主播王多多點評的話更是精妙,分享給各位 王多多的點評 「Faker是我們的處境,他是LPL永遠繞不開的一個人和話題,所以我們特別渴望在決賽跟他相遇,去直面我們的處境。 我們曾經稱他為最高的山,最長的河,以為山海就是盡頭,可是Faker用他28歲的年齡...
Thumbnail
本文提供了一個關於模擬法演算法的問題,介紹了操作指令的格式及其解析。透過程式碼模擬每條指令,找出回到根目錄所需的操作次數。本文詳細說明瞭模擬法的複雜度分析,能夠幫助讀者更好地理解這個問題。
前言 在閱讀《強化式學習:打造最強 AlphaZero 通用演算法》時,對一些看似基本,但是重要且會影響到之後實作的項目概念有點疑惑,覺得應該查清楚,所以搞懂後記錄下來,寫下這篇文章(應該說是筆記?)。 正文 下面這段程式碼: model = Sequential() model.add
Thumbnail
解決電腦上遇到的問題、證明正確性、探討效率 並且很著重溝通,說服別人你做的事是正確且有效率的。 內容: 計算模型、資料結構介紹、演算法介紹、時間複雜度介紹。