不知道大家有沒有發現一件事情,就是現實世界充滿了雜訊,你可以做一個實驗看看,拿起你的手機去錄影,回放影片的時候你把音量調到最大,這時就會聽到一片吵雜聲,這個吵雜聲就是環境中出現的底噪。
在安靜的環境下也許你沒有感覺,如果到車水馬龍的大馬路旁,試試看跟人聊天,你會發現聲音根本就聽不清楚,必須要喊的很大聲才聽的到,這代表環境中的聲音大過了你講話的聲音,也就是雜訊大過了真實的訊息。
這時要怎麼解決?
第一、換個安靜的地方去聊天,降低雜訊。
第二、喊的大聲一點讓對方聽見,提高訊息的能見度。
這個就叫做所謂的雜訊(noise),如果我們用示波器來解釋,雜訊就是我們不要的訊號,因為會影響我們對於真實訊息的判斷。
所以只要是有需要判斷訊號的場合,都會出現雜訊,只不過在統計學上不叫雜訊,叫做變異或是誤差。
今天要介紹的書就叫做《雜訊:人類判斷的缺陷》,作者有三位知名學者,分別是諾貝爾經濟學獎得主和暢銷書《快思慢想》的作者丹尼爾. 康納曼(Daniel Kahneman)、巴黎商學院的商業政策教授奧利維. 席波尼(Olivier Sibony)、律師凱斯. 桑思汀(Cass R. Sunstein)。
這本書在說什麼呢?
主要在說人類有兩種判斷上的錯誤,這兩種錯誤大大了影響社會的運作,就連所謂的專家,下的判斷可能比黑猩猩射飛鏢還不準,這到底是為什麼呢?
不知道大家有沒有打過靶,假設你和一群朋友去打靶,每個人給十發子彈去打靶,可能會出現以下四種情況:
狀況一、 彈孔又準又集中,
狀況二、 彈孔不準但集中,
狀況三、 彈孔很準但分散,
狀況四、 彈孔不準又分散。
理想的狀態應該是狀況一,彈孔又集中又準,最好是彈彈命中紅心;狀況二問題也不大,彈孔打的很集中只是打不準而已,稍微調整一下位置就很快回到狀況一的水準。
狀況三其實有打中紅心,只是落點大部分比較分散,這有可能是槍的狀態、手的穩定度、環境等問題所導致的,稍加練習或是換槍都還有機會變準,只是會比較花時間。
最麻煩的就是狀況四,打的又散又不準,這可能不是練習能解決的,說不定是連槍都拿不好,問題很大。
如果類比到人類的判斷上,如果我們下的判斷目標是正中紅星,狀況二就是人的偏誤或偏見,狀況三就叫做雜訊。
偏誤或偏見還好理解,就是你下的判斷失準,這有可能是你個人的偏見、被帶風向,或是資訊不足充滿了未知數影響判斷( 書中叫做客觀的無知)。
雜訊又是什麼意思,為什麼說我們下的判斷會分散嗎?
這邊就舉幾個案例來幫助我們理解什麼叫做雜訊。
附帶一提,在統計上偏誤叫做準度Ca (Capability of Accuracy)、雜訊叫做精度Cp ( Capability of Precision ) ,Ca與Cp還有個組合計算公式叫做Cpk製程能力,通常Cpk數值越高,代表工廠製作能力越精準,在製造業做過品保或是製程的人應該都很熟悉這個專有名詞。
1981年進行了一項試驗,研究提出16個假設案件,請美國208位法官進行裁決,
在這16個案件當中,僅僅只有3個案件,是所有法官全數同意判處入獄服刑。
在其他的案件當中,每位法官裁定的刑期卻是有長有短。
其中有一樁詐欺案件,法官裁定平均刑期為8.5年,可是最長的卻是無期徒刑,而另外一個案件平均刑期為1.1年,最長的則是15年。
同樣的案件怎麼會差異這麼大,這個刑期的差異就是人類判斷的「雜訊」,就像你打靶打的準但是卻打的很分散一樣。
而且判斷的雜訊還不只是人與人之間的差異而已,法官還會受到外界的因素干擾,進而影響他的判決。
在法國有一項研究指出,量刑當天如果是被告生日,法官通常會比較寬容。
還有一項研究結果發現,如果主場球隊如果在週末輸球,當地的法官在星期一的量刑會比較嚴格,反之如果是贏球,法官則會比較寬容。
所以人真的很容易受到外在因素影響,我還記得我小時候要拿考卷給我媽簽名,如果考不好就要挑大人吃飽飯後會比較沒事,因為吃飽了心情會比較好,被罵的機會小很多,要是白目在大人忙的時候拿過去,被罵就算了,通常還要吃竹筍炒肉絲( 以前崇尚不打不成器 )。
那你一定會想問,就算是判斷有差異,對我日常生活會造成什麼影響嗎?
我沒事又不會去跑法院。
如果這樣想就大錯特錯了,人每天無時無刻都在做決定,做決定本身就是一種判斷,日常生活中有太多需要判斷的狀況了,特別是在一些影響面比較大的決定上,判斷錯誤可是會出大事的,接下來就來說說雜訊到底會對我們產生什麼影響。
有在跑醫院的人可能會遇到一個問題,當我們今天生病了,如果找不出病因,你會怎麼做?
你一定會去找醫生,也許是先去家裡附近的診所,找不出原因然後轉診到大醫院,到了大醫院還要做一大堆的檢查。
光是檢查結果,每位醫生的判斷就可能都不一樣,萬一判斷錯誤或是遲遲找不到原因,可能會導致延誤治療,誇張點甚至送命,所以說醫生的判斷也是充滿了雜訊。
這就是為什麼老人家常說,看病要有醫生緣,因為每位醫生的判斷都會有差異,遇到大病你可能會需要多看幾位醫生,這樣會比較保險。
而且上班族還會遇到另外一種雜訊,就是來自主管判斷的雜訊,當你今天去找工作的時候,不同面試官對你的評價可能天差地遠,也許你很適合這間公司,如果面試官不喜歡你也沒轍。
另外像是績效考核,不同的主管績效考核也不一樣,就算是同一位主管,不同時間對你的考核評分可能也不會一樣。
簡單來說,判斷就是因人而異,
有的人可能比較嚴格,有的人比較寬容。
有的人對某件事比較嚴格,對另外一件事比較寬鬆。
有的人在早上下的判斷,跟下午的結果可能也不一樣。
因為人不是機器,機器的判定可以用程式去設定,人天生就不客觀,我們都會帶著主觀意識去判斷,在判斷的當下會受到情緒、天氣、場合等等的外在因素所影響,
所以只要需要人為判斷的狀況,就無時無刻充斥偏見與雜訊。
那你一定想問,要如何降低雜訊呢?
這邊還是提到打靶的例子,今天你打靶打偏了但是彈孔很集中,這個問題很好解決,當下調整一下準心就好。
如果是打的很分散,要調整就需要花一點時間了,通常最快的方式是換把槍。
在我工作的場合也很常遇到精度的問題,譬如某機台做出來的尺寸很分散,通常換精度高的機台就解決了,只不過往往會卡在錢的問題,因為高精度機台老闆不見得願意投資,所以說雜訊也不是越低越好,有時候也要考量成本,理想狀態當然是零雜訊,不過考慮到口袋深度,我們其實只要降低雜訊到可接受的程度就好。
回過頭來討論,人為判斷產生的雜訊要怎麼搞定呢?
最大的問題就在我們可能根本就察覺不到或無法預測,就像前面提到法官的例子一樣,那是因為用統計的手法去研究,才會發現同一個案件,判斷的刑期會差這麼多。
書中提到一個方法叫做「決策保健」,就有點像是預防疾病傳染一樣,新冠疫情其間,外出的時候你根本不知道誰中獎染疫,你又不可能天天待在家不出門,所以應對的方法就用勤洗手、戴口罩的方式去避免染疫。
簡單來說就是事前預防勝於事後治療,既然事前不知道哪裡會有雜訊,那就準備一套方法去降低雜訊。
這套方法有以下四點可以幫助我們降低雜訊:
前面也提到醫療的判斷也充滿了雜訊,所以我們可以使用統計思維、外部觀點,這樣才不會受個人的主觀意識所影響。
Google 從 2017 年進行一樣計畫,透過AI技術用於 X 光檢查的判定,希望提升乳癌檢測機率,早期發現早期治療,希望協助醫生提前發現癌症。
最新的研究顯示,AI診斷的結果與專家相比, 診斷出乳癌的準確性更高,假陽性與假陰性的情況都減少了,美國測試的結果發現,AI可以降低 9.4%的誤判率。在英國則是由兩名放射科醫生判定,AI可降低 5.7%的誤判率,
所以我們可以期待未來 AI 能夠協助醫生進行更準確的判斷。
當嬰兒從媽媽肚子裡出生,醫生就必須馬上進行判斷,如果情況不對,就要為新生兒進行急救措施,前面我們提到,只要是判斷就會有雜訊,萬一醫師判斷錯誤就會延誤急救時機。
所以婦產科有一個判斷的方法,叫做阿帕嘉計分評估表,把新生兒的狀態評估拆解成五個項目,分別是「心跳速率」「呼吸速率」「反射能力」「肌肉張力」「皮膚顏色」等五項,每項最高兩分,五項加總滿分為10分。
如果加總後的分數在4分以下,就代表新生兒需要立刻急救。
利用這個方法就能在短時間內,判斷新生兒的狀況,減少誤判的情況發生。
這邊問大家兩個問題,
(1)一隻球棒和一顆棒球共計1.1美元,球棒比棒球貴1美元。那棒球的價錢是多少?
(2)如果5台機器在5分鐘內生產5個產品,100台機器生產100個產品需要多久時間?
第一個問題,通常我們會直覺判定答案是0.1美元,不過正確答案是0.5美元。
第二個問題,你可能會以為是100分鐘,不過實際上你算算看,只需要5分鐘就夠了。
在快思慢想一書提到,人腦有兩個系統在運作,在快思系統我們往往會依賴直覺去判斷,當你是專家、領導者、主管,就更不容許別人質疑你的判斷,問題就在人的判斷,一定會產生誤差。
剛剛的問題叫做認知反射測試,主要是在測試一個人是用直覺還是思考在進行判斷。
有時候人的第一直覺可能會是對的,因為直覺是來自於過去的經驗與專業,但是我們很難保證一定會是對的,所以直覺出現的時候,先不要太早相信直覺,反而是慢下來先思考,萬一你是錯的怎麼辦?
人類的判斷會有偏誤與雜訊,如果說是綜合許多人的獨立判斷呢?
不知道大家有沒有聽過雷根糖實驗,有一個罐子裝滿的糖果,請大家猜猜罐子裡面的糖果數量,結果很好玩,所有人預測的平均值往往就是真實數量的理想估值。
而且比大部分的人預測更準確,這邊想說的就是所謂集體優於個體的概念,既然個人判斷有偏誤,綜合多名判斷者的獨立判斷呢?
我覺得最好用來比喻的方式就是「瞎子摸象」,每個人的立場、觀點、想法都不一樣,有的人摸到象鼻就認為大象是像水管一樣;有的人摸到象耳;有的人摸到象腿,每個人認為的大象長相一定都不一樣,可是把他們的判斷綜合再一起,大象的全貌就出來了。
簡單來說,這四項最重要的事,就是要你認清楚「人就是天生不客觀」,哪怕是用AI或統計進行判斷,都會因為資訊的不足產生誤差了,更何況是人的判斷。
所以降低雜訊的方法就是要減少人類單獨判斷帶來的偏差。
人的判斷有兩種錯誤,偏誤與雜訊,就如同打靶一樣,偏誤就是打不準,雜訊就是打太過分散。
現實生活中有許多領域,如醫療、法律、經濟預測、法醫鑑定、保險、人事、績效評估等等領域,這些判斷出現雜訊令人感到頭大。
假設你因為心悸去看醫生,如果一位醫生跟你說心臟有問題,另一位醫師說跟你說壓力大,你要相信誰? 從個人到組織及國家,都要每天都要面對各種決策與判斷,判斷的失誤,小則只是金錢上的損失,大則就會出人命。
以2021年Covid-19大流行為例,許多國家誤判病毒的威力,新聞上每天新增的重症與死亡人數,令人怵目驚心,光是當局一個判斷錯誤,奪走可是成千上萬的人命。
所以判斷出現雜訊不是沒有代價,只是我們不自覺是問題罷了。