由於我們是以程式跟股市菜雞為出發點撰寫該系列,所以我們還是必須來講解一下股市的一些基本常識以及知識才行,接著也會講解一下我們整個數據分析從頭到尾的流程順序為何,這樣往後你想要自行進行金融數據分析時才不會不知所措,那我們就開始今日的教學吧!!
股市基本常識認知
股票市場
我們股票市場大致上可分成兩類
- 初級市場 : 指資金需求者(包括政府單位、金融機構及公民營企業)為籌集資金首次出售有價證券予最初購買者之交易市場,例如我們熟知的股票IPO(首次公開發行)就是屬於初級市場
- 次級市場 : 次級市場也就是我們股票交易最直接的地方,分別是集中市場,也就是我股票上市交易的市場,以及店頭市場,也就是我們股票上櫃交易的市場
交易所
台灣負責股票交易的單位叫做「台灣證券交易所」,成立於1961年10月3日,交易時間為每個星期一至五的9:00~13:30,遇休假則會停市,近期則是連補上班上課的日子也會休市,而如遇天災得停班停課的日子,則是以台北市宣布的公告為準,如台北市宣告停班停課,則證交所休市,而台北市宣布正常上班上課,就算其它縣市宣布停班停課,證交所依舊會開市
上市上櫃家數
我們結至2020年上市上櫃的家數,上市家家數為948家,上櫃家數為782家,加起來共1730家公司可以供我們交易,實在是越來越多可投資的標的了,已經無法像上一輩的人一樣,每天都能分析好每家股票的狀況,這時程式就是很好的輔助工具
交易模式
在9:00~13:30的交易時間,我們稱為盤中交易,在2020年10月之前,我們盤中交易最小交易單位至少要交易一張股票,一張就等於1000股的意思,而低於1000股的我們稱之為零股,以往都是在13:40~14:30之間有一個盤後交易才能進行買賣,但在10月之後,盤中也已經開放零股交易,這對於我們這種大數據分析很講究的風險控管相當有幫助,因為這樣我們就不用去在意股票的價格高低限制了
投資小知識
1.賠錢比賺錢容易
假設我們今天投資的起始資金為10萬元,第一個月很幸運的我們報酬為100%,也就是說,我們的資金來到了20萬,但如果我們第二個月很不幸的賠掉了50%,這樣我們的資金又回到了10萬元
這告訴我們,「停損」很重要,停損也就是當我們賠錢到一定比例時,就一定要無條件出場,那是因為我們賠了50%,就要用100%的獲利才能賺回來,為了這惡性循環持續擴大,我們就必須嚴厲執行停損
2.投資要分散風險
今天不論投資任何一種商品,我們都不能夠將大量的資金放在同一個商品上,畢竟投資意味著存在風險,我們永遠都不知道我們會不會成為下一個賠錢的受害者,既然在不確定的情況下要投資,就只能控制投入的資金比例,最大的損失也只是將投資該商品的資金比例虧完,不至於造成總資金太大的衝擊
3.長線投資能夠利用時間彌補技術
根據長期的投資研究,當投資期限越長其實越容易獲利,我們可以從以下這張圖輕易地看出短線交易究竟賺不賺錢
我們拿2021/3/25的當沖資料來看,當沖總獲利最高的是台積電,總獲利為3358萬,但別看似這當沖賺很多,現在當沖的人可是更多啊,平均下來每張不過是賺1744元,仔細往下看,每張平均要賺破千的股票跟本少之又少,更何況這獲利其實大多集中在少數的人手中,幾乎當沖的人根本就只能賠錢收場,像我身邊的許多當沖朋友,幾乎沒有一個人在當沖市場賺到大錢的,反倒是長線投資的朋友,其實他們並沒有特別會什麼投資技巧,但卻能賺的比這些每天講得頭頭是道的當沖朋友還要多
4.金融大數據分析並非萬能
在這我們還是必須先來釐清一下,我們是如何利用程式來進行大數據分析的呢?沒錯,我們就是利用大量的歷史資料來進行分析的,或許在其他領域上歷史資料很有幫助,但在股市上這就不好說了,由於股市存在著人為的因素,其實只要有錢,想要打破既定的理論是件簡單的事情,但難道大數據分析就不能使用了嗎?錯了,我們是要拿來進行「輔助」,就跟目前許多AI一樣,是用來輔助專業,而非取代專業,我們可以利用程式幫助我們快速找到符合條件的股票,或是幫助我們找出最佳的投資組合,幫助我們快速執行我們的策略,抑或是幫助我們預判明日的漲跌機率,甚至是股價可能會落在哪裡,雖然未來會不會取代投資人,真的讓AI自行思考或自行創造交易策略,這我不知道,但至少目前要取代投資人交易還是一大難關
數據分析流程
數據分析的資料大致上可分成4大步驟
1.訂定分析目標
首先第一步當然是要有一個明確的目標,像是我們想要分析台股跟美股之間的相關性,或是我們想要預測明日某檔股票漲跌的機率等等,當我們有了明確目標後,我們才能夠繼續進行下一步驟
2.抓取相關資料
當我們訂好目標後,接下來就是需要獲取相關數據才行,那要如抓到數據呢?當然就是從資訊量爆炸的網路上獲取拉,當然,資料獲取的難易度以及完整性就取決於是否付費,這部分就只能自行斟酌了,能獲取資料的像是各券商的APP、TEJ、網站上的數據等等
而以網站上的數據來說,又可分成有良心的網站,也就是免費提供Excel檔下載的,以及沒提供Excel檔的網站,而其中沒提供下載檔的我們就只能進行程式爬蟲來抓取,這部分我們往後的教學會教到
3.資料整理及分析
當我們獲得分析目標所需的數據後,接下來就是利用我們先前教的Numpy、Pandas等等模組進行數據整理以及分析,這部分我們之後也會教到,這裡就先了解一下就好
4.結果圖視化
一般我們研究資料當然不會只是分析給自己看而已,往往都是要分析給老闆或是老師等人看的,這時我們總不可能拿著一大串密密麻麻的數據給他們看吧,所以就必須要變成能夠一目了然的圖表才行,而在金融數據分析中,就會用到我們教過的Matplotlib跟seaborn等模組來視覺化,這我們往後也會進行示範教學
總結
今天大致上先讓大家了解我們台股的一些基本常識,以及分享一些我在股市中領悟到的知識,最後當然就是要了解我們最重要的數據分析流程為何,這樣我們學完這30天的教學後,想要分析其他數據時才能輕易的舉一反三