上期提要:前一篇文章中,我們提到機率是人類認知的罩門。人類腦袋天生對於機率的計算有障礙,使得風險評往往偏離事實,跟隨而來的決策行為就常常產生偏誤而付出不必要的成本。如乳癌檢測的解讀,因誤判機率(風險),而進行的過度醫療行為,就會產生的療資源浪費。又如這次疫情,若因為對普篩準確率的誤解,貿然用於超前部署的工具,反提高疫情失控的可能,將造成人命的損失。同樣的道理,研究員也是人,所以機率也造成研究工作上的罩門。我們將也看到因為對機率(風險)的誤判,造成投資上的不必要的損失。
以下的場景,相信從事股票研究的人,應不陌生:
A君為某公司的Key man(但不一定是內部人),研究員與其打交道多年,發現其預測公司獲利每10次會說中1次。現今在一次飯局,酒酣耳熱之後,A君滿心歡喜,竊竊私語地對研究員表示,今年公司接到一大客戶訂單,他預測可賺一個資本額,且信誓旦旦說,此次有九成的把握(註:真的EPS=10,且說中,即;真陽性),而失誤率約五成(註:EPS不是10元,卻以為10元,即;偽陽性),請問研究員就此研判該公司今年EPS為10元的機率有多高?
這種利用各種管道,取得內線消息(不一定違法),試圖造就資訊不對稱性,在投資市場取得優勢而獲取利潤的模式,在實務投資界並不少見。然而費盡心力所得到的獨家訊息,在解讀時,常犯偏誤卻不自知。以上面的例子,套用與上期文章中乳癌檢測相同算法(貝氏定理), 答案只有16%,跟A君信心滿滿說九成把握,其實差得遠呢!但實務上,因線民講的信誓旦旦的說詞,就冒然下重注,結果是損失慘重的例子卻時有所聞,落得只能自我調侃:這一頓飯真貴,花了我上百萬!
人類的直覺與機率世界往往有很大的落差。上例中,用統計學(機率學)的角度,經由上期的分析,我們知道主因是在於:盛行率。若用心理學的角度,就是人天生會犯忽略基率(base rate)偏誤。諾貝爾經濟學獎得主康納曼在<<快思慢想>>一書中,將這種偏誤的成因解釋為,人類腦中啟動系統一運作方式主導了我們的心智思維,也就是在好逸惡勞的天性下,我們只輕鬆地取用眼前表徵訊息,會忽略代表長期的基礎率。作者告誡我們(P209)"關於貝氏推理以及我們如何傾向犯錯,有兩件要記在心頭:第一就是基率很重要,即使你手邊有這個個案的證據,基率還是很重要。這一點在直覺上通常不是很顯著。第二點就是診斷證據給人的直覺印象常常是誇大的。"
上面例子雖說不少見,但實務上即使你已學會貝氏定理,想要計算出真正可能的機率卻有困難,因為例子中,基礎率1/10、真陽率90%,偽陽率50%,這三個關鍵數字,在真實世界裡,很難獲得明確的數字,它不像自然科學,可以經由不斷在實驗室裡重複實驗得來;也不像流行病學,可以經由過去的統計資料進行大數據研究,得到參考的數值。筆者從事多年研究工作的心得是,一家公司若沒有長時間追蹤三、五年以上,很難對上述關鍵數字成形可靠的經驗值(但也不是精確值),但能如此熟悉的公司畢竟是少數(這與巴菲特講每人的競爭優勢圈有限不謀而合)。大多數的實境是,研究員日常工作是窮盡洪荒之力蒐集資訊(公開或未公開),再解讀資訊進行預測的過程,其實是一種「小數據」推理。在擁有有限資訊(樣本)下,如何做到"一葉知秋"的精準預測,而不犯下"以偏概全"的錯誤推測,就是研究員工作最大的挑戰。
小數據推理的成因與潛在陷阱,前述<<快思慢想>>有專章介紹,這裡不再引述。我們該如何避免犯錯呢?有沒有規則(rule)可遵循呢?貝氏推理(Bayesian reasoning)在決策上是一個常用的工具。
貝氏定理、貝氏推理都是後人為了紀念一位英國牧師,湯馬斯.貝斯(Thomas Bayes)所命名,貝斯(1702-1761)是一個牧師之子,就讀於愛丁堡神學院,他的著名論文<<論以機率學說解決問題>>是在他死後,得助於同為牧師的好友理查.普萊斯(Richard Price)整理其遺稿,才得以重見天日,於1764年發表在英國皇家學會期刊。貝斯最終想証明上帝是否存在(註1),從而帶出一個具福爾摩斯式的問題:多少證據才能讓我們相信,某件我們原本不相信的事。或是另一種問法:以目前的證據,我們應該多相信(belief)這件事為真?例如一顆你不知它是公平的骰子,當你看到有人擲五次,出現四次5點,那麼你該多相信這顆骰子有鬼(不是每點都1/6的機率)呢?這種以終為始的逆機率(inverse probability)的思考(註2),巧妙地以機率語言,表達出如何把證據轉成機率性可靠度(信念)。其過程可以用以下方式表示<<機率思考>>(P184):
對某事新的相信程度=過去的相信程度+新證據的分量。
這直覺、簡單地令人驚訝的規則,卻在二百年後拯救了上千萬條人命。電影<<模仿遊戲>>(The imitation Game)描述的是數學家艾倫.圖靈(Alan Turing)在二戰中如何幫助盟軍破譯德國軍事密碼的真實故事。盟軍因為得利於破解納粹通訊密碼優勢,使歐戰提早了二年結束,避免了更多人命的犧牲。圖靈如何在混沌中找出秩序,成功破解,一直被當成最高機密嚴格保護,直到2012年才解密公諸於世,後人才了解貝氏推理是關鍵技術。解碼工作的核心挑戰就是將蒐集到的線索轉化成見解。從攔截到的敵方訊號,當成觀察到的資料,運用貝氏定理的逆機率計算,不斷反覆試誤(try and error),從而逐漸趨近真實。
研究員工作核心是在問:這一家是好公司?與貝斯牧師問:上帝是否存在?看似風馬牛不相及,但這種大哉問,其背後蘊含的都同屬認識論(Epistemology)哲學思維—我們是用趨近法認宇宙,隨著我們收集的證據愈來愈多,我們越來越接近真理。在股票研究實務上,我們必須將這種大哉問試著具體化與量化,否則在實際操作上只會落於「清談」。因此,研究員工作核心問心問題,就可形塑與量化為類似問題:依目前的資料,我該多相信這家公司今年EPS=10元呢?此時的機率可以用來衡量一個人對某件事的相信度(Degree of belief)。所以,估計一家公司EPS的過程,與破解密碼有異曲同工之妙。研究員首先要根據現有的資訊加上過去經驗,建立一個先驗的(Priors)EPS預估模型,再經由不斷蒐集的新訊息(可能是公司本身或產業)產生新證據的分量,用以修正原先EPS的相信程度,產生新的相信程度,如此就是研究員的日常:一直不斷試驗,以求趨近真實EPS。因此,運用貝氏推理,可以捕捉到研究員看到新證據後,是如何改變心意背後的邏輯,同時確保「如何讓證據說話」的最佳方式。
五四運動學者胡適所提倡科學的治學精神:大膽假設、小心求證,與貝氏推理可說英雄所見略同。只不過後者,更明確點出,假設就是建立先驗經驗,小心求證就是估算新證據的分量。至於在實務操作上如何建立先驗經驗,如何估算新證據的分量,則又是另一值得探討的議題了!
(註1):貝斯完成論文後,就將作品束之高閣,至今後人無法曉得為何貝斯從未發表這篇論文,也不知道他為何想出這個理論,只能從伴隨論文所表時,由普萊斯所寫導讀中猜測出來。
(註2):若我們已知是一公平骰子,求連續出現四次5點的機率,則屬於正向機率。