27.稍微認真做一個股市預測模型 - iT 邦幫忙::一起幫忙解決難題,拯救 IT 人的一天
不知道模型怎麼調,可以用暴力法try出來 使用GridSearchCV,就算你真的了解模型的原理也是一樣要用GridSearchCV,所以別怕不了解直接用GridSearchCV交叉驗證就不會用錯模型 昨天的變數只有用當天的資料,預測未來的股價 '成交股數', '成交金額', '開盤價', '最高價', '最低價', '收盤價', '漲跌價差', '成交筆數', '三大法人買賣超','外資自營商買賣超', '外資自營商買進', '外資自營商賣出', '外陸資買賣超', '外陸資買進', '外陸資賣出', '投信買賣超','投信買進', '投信賣出', '自營商買賣超', '自營商買賣超避險', '自營商買進', '自營商買進避險', '自營商賣出','自營商賣出避險', '融券今日餘額', '融券前日餘額', '融券現金償還', '融券買進', '融券賣出', '融券限額','融資今日餘額', '融資前日餘額', '融資現金償還', '融資買進', '融資賣出', '融資限額', '資券互抵', '借券今日可限額','借券前日餘額', '借券當日調整', '借券當日賣出', '借券當日還券', '借券當日餘額' 因該要計算幾天累積買的量,這邊設定累積4天的量 data['三大法人買賣超'].rolling(window=4).agg(['sum','std','mean','max','min','median','kurt','skew']) 上面的方法可以算過去3天加當天"三大法人買賣超"的總數、標準差、4天的最大值、4天的最小值、4天的中位數、峰度、偏度(還可以發揮創意繼續加上去,例如變化量的斜率) for col in data.columns: data=pd.merge(data, data[col].rolling(window=4).agg(['sum','std','mean','max','min','median','kurt','skew']),on='date',suffixes=('','_'+col)