聊聊「檢查悖論」(Inspection paradox)。如同過去曾經聊過的生日悖論與烏鴉悖論一樣,檢查悖論並不是真的會在邏輯上出問題的那種悖論。而更像是一種對於我們直覺的挑戰,乍看之下我們得到的結論會有些詭異,但它確實是如此。就像一開始的古希臘詞παράδοξος,原意是「未預料到的」、「不尋常的」。
最常被拿來舉例的是「等公車」的例子。我們知道公車其實是有固定車班,除了特別的尖峰或離峰時間,每班車的間距照理說不會差異過大。然而,實際在等的時候,我們依然會感受到公車難等(我知道有些人已經習慣用公車App來避免這種狀況,但並非所有地方都如此方便,也不是所有人都擅長使用這些科技工具)。
一種想法可能會覺得,這是我們的體感問題,很快搭到車的時候我們不會特別注意,但如果等待時間久一點,我們就會特別不高興,也會特別印象深刻。我同意會有這種狀況,且後面我們還會回頭來說這件事,但事實是,即便不關於這種體感差異,我們等公車的時間就是會比「隨機等公車的理論值」--「二分之一車班間距」來得更長一些。這便關連到了檢查悖論。
*
從抽樣統計的角度來說,檢查悖論是一種不恰當抽樣方式的必然結果。譬如,如果我們進入一間大學,挑選了兩個科系的學生,從中隨機選十個學生,問他們「你們班有多少人」。我們得到的平均答案將非常有可能大於兩個科系的平均人數。
譬如說,如果一個科系有70個人,另一科系有30人。我們從這一百名學生中完全隨機選中的學生,比例的分布也更有可能是7:3。那麼,平均下來的班級人數將會是58人而不是中間值50人。如果兩個班級(或兩間公司)人數差異更大,這個偏差就會更加明顯。雖然我們的選擇真的是隨機的,但由於我們要「檢查」的事情與數量相關,結果反而會偏離平均。
回到公車:雖然公車有固定的班表,但公車司機不是機器人,交通狀況也無法被百分之百預測。所以公車班次之間的間距就算「平均而言是固定」,仍會有些許的落差。而只要這樣的落差一出現,就立刻有了檢查悖論趁虛而入的空間。
在所有時間中,等車的人更有可能落在間距較長的時間裡面。這就如同一百個學生裡面,隨機的學生更有可能來自70人大班級一樣。所以我們的平均等待時間也就會隨之增加,公車與公車班次間距的差異越大,我們平均而言就需要等待越久。這個等待時間永遠只能往「久」的方向靠近,最理想的情況也就是理論值的「平均班次間距的一半」。
也就是說,不只是因為「等待令人煩躁」,等公車就是會比預期的要久。而這樣的數學角度還能夠被推展到生活中更多各式各樣的情境,譬如另一個聽起來同樣有些詭異的事情是:「你的朋友很可能擁有比你更多的朋友」。
其中的理由也很簡單,因為相比於成為「只有五個朋友的人的朋友」,你會有更高的機率是「有一千個朋友的人的朋友」。就算你自己就是那個有一千個朋友的人,只要思考一下你的那些朋友看到這個問題時會立刻想到你然後說「對耶!他的朋友一定比我多」就能理解這是怎麼一回事了。好比你是那個明明上一班公車剛走卻馬上搭到下一班公車的人--剛好對比了其他人等車等得有夠久。
*
最後,我們想要多推進一點點的事情是:其實那種「等比較久的時候會印象深刻、很快搭到車時不會特別記得」的狀況甚至也跟這個現象有關。因為「等很久」和「很快搭到」兩種情況花費的時間一樣是不對等的。我們會在很長的時間中處於「等很久」的狀態,而「很快搭到」時我們則立即結束了等車這件事。
所以這不僅僅是因為我們厭惡等車,於是用自己的煩躁去強化那種記憶的重量。就算我們並不特別去加權那任何一刻的「等待/無需等待」,等待永遠會比最固定與最隨機的「理論值」設想得更煩更久。更不用說,那種煩悶並不是均值的,往往會一層一層、不斷累積上去。
所以如果下次聽到有人和你抱怨他等公車等很久,請不要挑戰他。你知道,他是對的,可以點點頭跟他說:「等車辛苦了」。
延伸閱讀: