數與人系列:貝氏的未來

閱讀時間約 3 分鐘
統計既然是關於猜測的科學,那麼如何隨著時間發展,根據新事件或新資訊的發生來形成新的假說(或新的估計),自然就會成為數字人想要解決的問題。在網路資訊尚未發達之前,這可能要牽涉到重新收集一批新的資料再處理分析,可是在網路時代,資訊經常源源不斷,數據界分析這類資訊的重點就轉變成如何處理這些一直產生的新資訊。
於是,有人建議將大數據的分析稱為大S,而從前由實驗設計開始發想的統計分析叫做小S,作為區分。
不過,大S和小S自然還是牽涉到許多相同的統計原理,而且有些在小S應用不易的定理,到了大S就顯得似乎容易多了。
貝氏定理(Bayes‘ Theorem)就是其中一例。( 下圖是 常見的 (小S)貝式定理公式,圖片來源:Lavanya.ai
貝式定理
這個公式牽涉到傳統小S的條件機率計算,許多人在學習時大概就是「背下來」,其實不太清楚其意義,所以也不太知道怎麼應用。但是,這其實是一個蠻符合「直覺」發展出來的預測觀念,所以在貝牧師 (Thomas Bayes) 提出這個公式時立刻就獲得很多人的支持,但也因為牽涉到一些事前猜測,招致很多人的批評。
不過,因為「貝式定理」牽涉到「可能發生」也「可能不發生」的事件,所以在大數據時代,有電腦按照程序來處理複雜的數據時,其實就容易理解多了。下面就是演算法的程序(其實也是貝最初給的程序,只是被簡化整理成上面的形式):
在這個情境中,我們想比較兩種事件發生的機率 —— 比如說,A事件 :covid-19 武漢株入侵台灣且正流行,B事件:covid-19 英國株入侵台灣且正流行,而 X事件是每天死於新冠肺炎的人數,我們可以依照下列程序來推算 AB 事件的發生比率。
第一,估計A事件和B事件的相對機率
第二,根據每一天死於新冠肺炎的人數,分別計算他們是死於武漢株還是英國株的可能性。
第三,根據二的資訊,利用貝式定理,估計每一天 A事件和B事件的相對機率。
也就是說,如果我們能估計每一天死於新冠肺炎的人中,究竟有多少是死於武漢株還是英國株的比率,我們就能每天都重新計算現在在台灣流行的病毒株究竟武漢株還是英國株。
根據這個資料,我們應該也可以推算從今年五月在萬華爆發的疫情,究竟是「英國株」還是「武漢株」。如果在萬華爆發然後蔓延全台的是英國株,那我們也許就可以先推論這波防疫最有可能的破口是桃園國際機場,而且和「3 + 11」政策有關。( 相關文章: 3+11 隔離政策惹議,陳時中:我負責。)
當然,貝式定理在資訊社會中最重要的意義還是猜「未來」,所以我們也可以利用這個定理來猜未來疫情的爆發點會是在哪裡,只是,如果要當料敵機先的諸葛亮,這就要先選定一些還沒有爆發但還很有可能爆發的地點來觀察或快篩。
只是,如果因此成功阻截了病毒,以致該點最後沒有爆發群聚疫情,恐怕又要被一些人說「你這烏鴉嘴,居然說這裡會爆發,可是就沒有啊!」 這樣的風涼話了!
在這種情況下,或許還是普篩,比較能免去無謂的口舌之爭吧?
avatar-img
52會員
425內容數
曬書天,好奇地。 文圖連播,播出新識界。 紅柿子在這方小天地不只曬書,也曬心得。
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
如果實驗設計或執行不良,要解釋實驗結果就可能出現很多可能。單純增加受試者數目,在數學上說得通,但可能對了解實際作用機值幫著不大。
費雪(Fisher)既然是從「劍橋下午茶事件」後,開始思索用統計來解決「主觀」與「客觀」的問題,「品茶問題」自然就開始在統計發展中扮演重要角色。從「品茶問題」開始,我們可以比較哪種可樂比較好喝,哪種止咳藥比較有效,還有 哪種疫苗比較有效嗎?
既然「經濟學」強調理性,「行為經濟學」著重分析的就是消費行為的理性與不理性,其中,「贏家的詛咒」(The winner’s curse)算是行為經濟學最早提出的概念之一。要如何才能避免贏家的詛咒呢?心理學家有建議,但大多贏家往往無法反而落入更深的陷阱。
話說 1920 年代,一群大學教員和他們的賓客一起在戶外喝下午茶。其中一位女士表示,喝茶時,將茶倒入牛奶和將牛奶倒入茶的味道是不同的。在場的許多科學家(從他們的化學知識來看)認為這種說法是很可笑的。但女士非常堅持相信自己的感覺。 如果你也在座,會如何解決這項爭議?
照「集體免疫」的概念,在某一生活圈中,當然是要有一定比例的群眾施打過疫苗,才能減輕醫療相關單位的照護負擔。然而,從已知的資訊來看,「打疫苗」後的「小狀況」大約難免,而出現「大狀況」的機率雖小,也不是為零。 所以,民眾應該主動爭取疫苗的施打嗎?單從機率言,這是一個很難回答的問題。
「防疫」,是一個「快思」問題,有賴指揮官根據各種最新情報,即時因應。既然病毒的攻勢凌厲,與之對陣時,就不可輕敵,「同島一命團結抗疫」之外,更重要的是,指揮官必須調度得宜,才不致於傷亡太多。另一方面,台灣已久無戰事,所以,用「足球比賽」來了解疫情,也許比較容易引起共鳴。
如果實驗設計或執行不良,要解釋實驗結果就可能出現很多可能。單純增加受試者數目,在數學上說得通,但可能對了解實際作用機值幫著不大。
費雪(Fisher)既然是從「劍橋下午茶事件」後,開始思索用統計來解決「主觀」與「客觀」的問題,「品茶問題」自然就開始在統計發展中扮演重要角色。從「品茶問題」開始,我們可以比較哪種可樂比較好喝,哪種止咳藥比較有效,還有 哪種疫苗比較有效嗎?
既然「經濟學」強調理性,「行為經濟學」著重分析的就是消費行為的理性與不理性,其中,「贏家的詛咒」(The winner’s curse)算是行為經濟學最早提出的概念之一。要如何才能避免贏家的詛咒呢?心理學家有建議,但大多贏家往往無法反而落入更深的陷阱。
話說 1920 年代,一群大學教員和他們的賓客一起在戶外喝下午茶。其中一位女士表示,喝茶時,將茶倒入牛奶和將牛奶倒入茶的味道是不同的。在場的許多科學家(從他們的化學知識來看)認為這種說法是很可笑的。但女士非常堅持相信自己的感覺。 如果你也在座,會如何解決這項爭議?
照「集體免疫」的概念,在某一生活圈中,當然是要有一定比例的群眾施打過疫苗,才能減輕醫療相關單位的照護負擔。然而,從已知的資訊來看,「打疫苗」後的「小狀況」大約難免,而出現「大狀況」的機率雖小,也不是為零。 所以,民眾應該主動爭取疫苗的施打嗎?單從機率言,這是一個很難回答的問題。
「防疫」,是一個「快思」問題,有賴指揮官根據各種最新情報,即時因應。既然病毒的攻勢凌厲,與之對陣時,就不可輕敵,「同島一命團結抗疫」之外,更重要的是,指揮官必須調度得宜,才不致於傷亡太多。另一方面,台灣已久無戰事,所以,用「足球比賽」來了解疫情,也許比較容易引起共鳴。
你可能也想看
Google News 追蹤
Thumbnail
  在一次戴康尼斯協助賭場檢查自動洗牌機的缺陷後,賭場高管告訴他:「我們不喜歡你的結論,但我們相信它,這也是我們雇你來的原因。」賭場高管的說法很好地說明了人類大腦與機率之間的關係,我們通常不那樣思考事情,即便知道了也不太願意接受。但作為一個利益至上的機構,賭場謙遜地服從於機率,而這是常人難以做到的。
Thumbnail
除了「夠好」經驗法則和避免最壞結果的決策模式外,作者也特別強調機率和自然頻率的觀念。 我們在前面討論蒙提霍爾問題時已經稍微接觸過,接下來我們繼續進行更深入的探討。以下是作者舉的一個例子: 女性罹患乳癌的盛行機率是1%。 如果一名婦女有乳癌,那麼她檢驗為陽性的機率是90%。 倘若一名婦女沒有乳
Thumbnail
  前面說明了所謂「假設檢定」的邏輯,也就是推論統計的基礎。但前面都還只是概念的階段,目前沒有真正進行任何的操作──還沒有提到推論統計的技術。   這篇其實有點像是一個過渡,是將前面的概念銜接到下一篇t分數之間的過程,也可以說是稍微解釋一下t檢定怎麼發展出來的。
Thumbnail
大家好,我是小畢,本書作者也是暢銷書致富心態的作者,再一次藉著許多新故事,訴說著生活和投資上始終不變的真理,唯有認知這些一如既往的道理,才能在面對生活或是投資上的困境時,能夠處變不驚做出最好的應對,而不至於陷入失敗的處境。 首先作者以歷史事件,例如新冠肺炎或是一九二九年的經濟大蕭條,說明所謂的
Thumbnail
3 月 11 日上午11:55(美國東部時間)紐約時報網站與實體報紙(10日)以標題「四年過去了,新冠病毒之謎正在解開」盤點了新冠科學現在式的7個問題,有趣的是在文章最後引用了聖路易斯華盛頓大學臨床流行病學家 Ziyad Al-Aly的話作為結論,雖然新冠病毒的許多謎團已經解開,但事實上...
Thumbnail
接續上一篇,繼續來講如何從常態分布的機率進行假設檢定,進而推論母體的平均數吧! 這篇會提到否證的邏輯、魔法數字0.5以及統計檢定到底是什麼這三個主題。
Thumbnail
有別於試圖直接從數據中找出洞察,商業分析的精髓在於先思考 so what——從定義目標開始,做出商業決策的雛形後,才用數據去支持假說。這篇文章介紹 A/B 測試的技巧,以及摘櫻桃的應用,解說數據篩選的操作、摘櫻桃的好處,以及企業案例:數位轉型後的報社,亞馬遜CEO貝佐斯改造百年郵報。
Thumbnail
  在上一篇文章解釋了常態分布怎麼幫助我們計算事件發生的機率,而更之前也看過了抽樣分布是如何形成常態分布的過程,現在就要利用這兩件事情來慢慢帶出什麼是統計學中的「假設檢定」了。
Thumbnail
"管過去它做了什麼"是絕對不對的觀念,不是只有政治而已,而是為人處世必須要小心萬劫不復的陷阱。 在數學或流行病統計上有一個叫做貝氏定理,應用在觀察一個人,則相當於觀察他失去信任的過程。
Thumbnail
  在一次戴康尼斯協助賭場檢查自動洗牌機的缺陷後,賭場高管告訴他:「我們不喜歡你的結論,但我們相信它,這也是我們雇你來的原因。」賭場高管的說法很好地說明了人類大腦與機率之間的關係,我們通常不那樣思考事情,即便知道了也不太願意接受。但作為一個利益至上的機構,賭場謙遜地服從於機率,而這是常人難以做到的。
Thumbnail
除了「夠好」經驗法則和避免最壞結果的決策模式外,作者也特別強調機率和自然頻率的觀念。 我們在前面討論蒙提霍爾問題時已經稍微接觸過,接下來我們繼續進行更深入的探討。以下是作者舉的一個例子: 女性罹患乳癌的盛行機率是1%。 如果一名婦女有乳癌,那麼她檢驗為陽性的機率是90%。 倘若一名婦女沒有乳
Thumbnail
  前面說明了所謂「假設檢定」的邏輯,也就是推論統計的基礎。但前面都還只是概念的階段,目前沒有真正進行任何的操作──還沒有提到推論統計的技術。   這篇其實有點像是一個過渡,是將前面的概念銜接到下一篇t分數之間的過程,也可以說是稍微解釋一下t檢定怎麼發展出來的。
Thumbnail
大家好,我是小畢,本書作者也是暢銷書致富心態的作者,再一次藉著許多新故事,訴說著生活和投資上始終不變的真理,唯有認知這些一如既往的道理,才能在面對生活或是投資上的困境時,能夠處變不驚做出最好的應對,而不至於陷入失敗的處境。 首先作者以歷史事件,例如新冠肺炎或是一九二九年的經濟大蕭條,說明所謂的
Thumbnail
3 月 11 日上午11:55(美國東部時間)紐約時報網站與實體報紙(10日)以標題「四年過去了,新冠病毒之謎正在解開」盤點了新冠科學現在式的7個問題,有趣的是在文章最後引用了聖路易斯華盛頓大學臨床流行病學家 Ziyad Al-Aly的話作為結論,雖然新冠病毒的許多謎團已經解開,但事實上...
Thumbnail
接續上一篇,繼續來講如何從常態分布的機率進行假設檢定,進而推論母體的平均數吧! 這篇會提到否證的邏輯、魔法數字0.5以及統計檢定到底是什麼這三個主題。
Thumbnail
有別於試圖直接從數據中找出洞察,商業分析的精髓在於先思考 so what——從定義目標開始,做出商業決策的雛形後,才用數據去支持假說。這篇文章介紹 A/B 測試的技巧,以及摘櫻桃的應用,解說數據篩選的操作、摘櫻桃的好處,以及企業案例:數位轉型後的報社,亞馬遜CEO貝佐斯改造百年郵報。
Thumbnail
  在上一篇文章解釋了常態分布怎麼幫助我們計算事件發生的機率,而更之前也看過了抽樣分布是如何形成常態分布的過程,現在就要利用這兩件事情來慢慢帶出什麼是統計學中的「假設檢定」了。
Thumbnail
"管過去它做了什麼"是絕對不對的觀念,不是只有政治而已,而是為人處世必須要小心萬劫不復的陷阱。 在數學或流行病統計上有一個叫做貝氏定理,應用在觀察一個人,則相當於觀察他失去信任的過程。