方格精選

讀書誌:《大數據的傲慢與偏見:一個「圈內數學家」對演算法霸權的警告與揭發》

更新於 2020/06/30閱讀時間約 5 分鐘
這本所謂「大數據」著作(《偏見》),主要內容是關注隱藏在我們四周的「演算法」,中文副題《一個「圈內數學家」對演算法霸權的警告與揭發》反而清楚指出著作內容。雖然有點感到「被騙」,也許側面印證「大數據」一詞具有盈利潛力,總要沾一沾。《偏見》內容很少涉及大數據,但專注演算法;尤其所謂「演算法霸權」,亦值得一讀。
為何選讀這類書籍?到處都在追捧大數據,大量「讓我告訴你成功運用大數據盈利的秘訣」書籍充斥市面,總是讓筆者嗅到那種「騙徒」的體臭。單憑直覺定罪不太公允,惟有篩走大量「發大財秘訣」讀本,先讀一些揭大數據瘡疤的作品,以備應對市面種種對大數據的歌功頌德。當然,可能令筆者矯枉過正,倒向另一個偏頗。
數學毀滅性武器 WMD
作者Cathy O'Neil從事與數據演算法有關的工作,故此多年來撰文指出種種問題。英文書名《Weapons of Math Destruction》,中文版譯作「數學毀滅性武器」。翻譯提醒讀者:「大殺傷力武器」(Weapon of Mass Destruction)的英文首字縮寫,恰巧都是WMD(21頁),似乎作者是故意為之,突顯現存的演算法弊端,並對人造成的廣泛傷害。
對甚麼人造成何種傷害?
書中談及的「演算法」,並非鬧得熱烘烘的Facebook或YouTube演算法,而是藏身於眾多電腦系統之中的數學模型。這些數學模型協助管理層作出日常決策,涵蓋教育、推廣銷售、銀行、保險、治安、求職、大學排名等等。這些工作本來由「人」擔任、做判斷,現在由電腦代勞,好處「多不勝數」:可以更快、更準確、更長時間(24/7 support)、更客觀(冷血/無情)、處理更大量資料。
然而,電腦和數學模型如何像「人」一般,去觀察、了解、查證另一個「人」?現階段AI仍未懂得認識、摸透一個人,像「人」一般對人評頭品足,但21世紀的資訊網絡及社交媒體,存放了大量我們的資料,在其中勤奮發掘(所謂的data mining),總有得著。
如何發掘?選取一個幫助我們對人作出判斷的「替代指標」,並靠賴數學模型中的「演算法」。《偏見》透過不同章節,分析「替代指標」如何錯誤標籤一個人,「演算法」如何錯誤運用資料,製作「替代指標」。兩者是合謀共犯,雙劍合壁之下就會出現極其荒謬的局面,例如如何評估客戶,分辨出他們是潛在的「豪客」或可以忽略的「窮光蛋」?由於不少個人信用/信貸/財務資料仍屬私隱,未能「隨意方便」取得,於是退而求其次,尋找/挖掘一些較少規管的資料,諸如點擊記錄、定位數據、郵遞區號等等(162-164頁),用作估算「替代指標」。於是,你在甚麼地方使用網絡(是否豪宅區或非裔、墨西哥裔聚居地)?閣下曾否瀏覽奢侈品網站?你居住的區域拖欠信用卡還款的比率高嗎?
既然如此,只要我不希罕「豪客」這個身份,「演算法」對我就無可奈何?且別高興得太早。《偏見》提及一些案例,經濟環境欠佳的人,更多在網絡搜尋有關政府援助的資料。既然知道這類人「有困難」,結果就讓你看見更多與「貸款」有關的網絡廣告,作者用的字眼是:他們”….令自己成為「掠奪」的目標….”(224頁)。
還有相似的案例。有些演算法/替代指標會認為:花時間看條款細則、正確填寫申請表的人,比較守規則,「信用」應較好。然而新移民、教育程度較低的人,填寫各種申請表時,拼寫及標點運用出錯機會較高,會被演算法視為「風險」一族,需要收取較高的借貸利息。這裡出現一個惡性循環:這類人士本來在借貸市場已經沒有優勢,高昂利率令他們拖欠還款機會增加,進一步強化這個演算法/替代指標的「自信」(176頁)。《偏見》還引述更多惡劣的例子,涵蓋前文提及的生活領域。
美國社會對此並非一無所知,為何多間機構仍繼續讓這種演算法運作下去,不願作出改善?
因為盈利。大機構使用演算法及替代指標,首要目的是改善盈利,財務報表既然報捷,目標已達;加上這演算法「苦主/受害人」並非他們心儀的「豪客」們,何解要節外生枝?若非「圈內數學家」(作者)及部份受害人喧嘩煩擾,恐怕會不了了之。
然而,政府機構也在使用演算法,他們也在追求盈利嗎?政府機構未必追求盈利,卻在意政績。在談及執法、治安問題一段,政府政績就是罪案減少,但背後的代價是甚麼?是更多非裔/拉丁裔居民,因為演算法的「助攻」被捕及入獄?但其他同樣犯法的較富裕白人呢(104-122頁) ?《偏見》在2017年出版,但仍可幫助我們了解多一點George Floyd案件的社會背景及氛圍。
「公平」一點,電腦不懂思考,會思考、留意公平與否的是人腦,電腦、演算法、替代指標「該當何罪」?締造一個公正幸福社會,不能依賴電腦和演算法,如作者所言:
“….數學毀滅性武器傾向重視效能……但公平是個含糊和難以量化的概念……因此,數學毀滅性武器不考慮公平問題。結果它們大規模地製造出不公平的情況….”(114頁)
資訊科技總會為全人類帶來美好將來?視乎你指涉的是「誰」的將來。《偏見》提醒大家,若果你不是「豪客」們,這個美好將來可能與你無關。
北望神州,我們看見更先進、更有效率的社會信用評分體制(1),大家感到幸福、美好嗎?
註:
(1) 《【中國社會信用評分】大數據打撃無賴成未來監獄?即計你有幾分》 (香港01 10/7/2019) https://www.hk01.com/數碼生活/350379/中國社會信用評分-大數據打撃無賴成未來監獄-即計你有幾分
即將進入廣告,捲動後可繼續閱讀
為什麼會看到廣告
avatar-img
29會員
130內容數
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
關間聞的沙龍 的其他內容
第一次看見書本名稱,以為是印刷出錯:1873-1898?才廿多年,梁啟超(1873-1929)不是如此「短命」嗎?後來知道《青年變革者 : 梁啟超 1873-1898》(《梁啟超》)是作者的三部曲巨構(自序第5頁)的第一部,涵括梁啟超出生至1898年間的人生足跡與事業作為,已經是超過380頁的磚頭書
有甚麼不能穿鑿附會到「國家安全」嗎?日後《國安法》實施,恐怕會以國家安全為由,壓倒無罪推定,寧枉毋縱,造成冤案連連。
兩個時代的作者,都深愛這個城市,或察覺城市的陰暗,為之著急;或憂患民間的淪喪,為之立志。
將來唱一首香港的歌,恐怕只能仿傚《一起》,一字不提這塊土地,惟靠心領神會。
《極》的社會觸角,毫無疑問超越不少昔日及同期作品。
《曾路得+四月之聲》與後來的《赤道》都是先行者,設身處地,我們不一定比他們更出色。
第一次看見書本名稱,以為是印刷出錯:1873-1898?才廿多年,梁啟超(1873-1929)不是如此「短命」嗎?後來知道《青年變革者 : 梁啟超 1873-1898》(《梁啟超》)是作者的三部曲巨構(自序第5頁)的第一部,涵括梁啟超出生至1898年間的人生足跡與事業作為,已經是超過380頁的磚頭書
有甚麼不能穿鑿附會到「國家安全」嗎?日後《國安法》實施,恐怕會以國家安全為由,壓倒無罪推定,寧枉毋縱,造成冤案連連。
兩個時代的作者,都深愛這個城市,或察覺城市的陰暗,為之著急;或憂患民間的淪喪,為之立志。
將來唱一首香港的歌,恐怕只能仿傚《一起》,一字不提這塊土地,惟靠心領神會。
《極》的社會觸角,毫無疑問超越不少昔日及同期作品。
《曾路得+四月之聲》與後來的《赤道》都是先行者,設身處地,我們不一定比他們更出色。
你可能也想看
Google News 追蹤
Thumbnail
徵的就是你 🫵 超ㄅㄧㄤˋ 獎品搭配超瞎趴的四大主題,等你踹共啦!還有機會獲得經典的「偉士牌樂高」喔!馬上來參加本次的活動吧!
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
Thumbnail
「技術分析」分析的就是投資人心理~「系統性風險」下,「基本分析」完全失靈,一點都不要參考 一定要導正你的危機處理觀念。完全失靈因兩大因素: ■人在恐慌情緒下,誰都是本能性思考 □混沌理論跟蝴蝶效應,讓你無法預測 該用「基本分析」是在「寧撈海底死魚,不抓空中飛鳥」時刻,也就是浮現個股長期投資價值時
Thumbnail
反省就是重寫自己的演算法吧? 假設我就是人工智慧,或心智的可以被看作爲人工智慧的編輯器,那我的程式碼是什麼樣的? 從懵懂無知到一無所知,從自以為是到自我消逝,心智只是執行它的內容,我也需要不斷優化。 最好的優化就是簡化。 最能創造財富的演算法就是關於如何除錯與減少任何風險。
本篇文章介紹了一種簡單但正確的評估方法,以投資評估總分和本益比為依據,給出了公司的投資評級,並以臺積電和NVDA作為範例。文章還提到了演算法的重要性,以及執行長數學的思路。建議投資者試用這種投資策略來輔助自己的投資。
Thumbnail
這本由德國作家彼強.莫伊尼創作的《演算人生》,講述了一個近未來的時空中,由公投接受名為「立方體」的演算法人工智慧作為社會系統,所引發的一系列故事。文章對於人工智慧的影響及可能的警示提出了值得深思的看法(這段摘要還是用人工智慧算出來的,真夠諷刺)。
Thumbnail
現在都在探討AI成形後的社會模式 每一個階段的習慣科技都只是為了我們人類的需求很誕生 不過在現階段的認知我認為人類始終能掌控科技 因為 AI人工智能最厲害的是"計算" 而我們人類最厲害的是"算計" "計算"靠的是公式."算計"靠的是想像 有算計的是世界才
Thumbnail
關於這本書,我認為...... 《深度數位大掃除》是一本出乎意料的優質好書。 自從社群媒體、大數據、人工智慧等陸續問世,對於科技如何快速進展,進而滲透人類生活的相關研究已屢見不鮮。原以為這類主題大概是敘述科技對人類生理、心理的負面影響,並提供一些老生常談的方法來杜絕。 但這本書卻提供另一個
Thumbnail
為了讀書會開始認真讀起買了但是放在書架上很久的中國研究相關書籍,挑上這一本就是看上大數據監控的部分。全書談的是中國的監控,而有別於單談新疆的大監控與再教育營,但實際上讀來,就是密度、強度的差異,手法類似,也恐怖莫名。 先從中共政權的槍桿子、筆桿子談起,先是集權的暴力壓迫,少數的族裔還有聲音消音在世
Thumbnail
閱讀筆記《懲罰貧窮:大數據橫行的自動化時代,隱藏在演算法之下的不平等歧視》 謝謝格友偶希都理的分享, 書中這段【授權檢舉者】的內容, 剛好提到這前陣子我曾有的感觸; 為了「真實」了解學生及其家庭的狀況, 就必須真實地「深入訪談」學生及其家庭的生活細節,包含家庭成員的互動,作息,甚至對話,尤
Thumbnail
★看似客觀中立的機器運算,可能在學習人類提供的資料後,再複製社會偏見與歧視,形成「自動不平等」!
前天看了《數值化之鬼》這本書,這本書由識學創辦人安藤廣大撰寫,深入的探討數值化的議題。 在生活與職場上,我們很常很聽到身旁人講數值化思維的重要性,但只有少數人真正理解數值化的真正含義,其中更只有微小的比例能夠真正實踐。 實際上,培養數值化思維並不需要深厚的統計基礎,數值化強調的是「用數字來思考」
Thumbnail
徵的就是你 🫵 超ㄅㄧㄤˋ 獎品搭配超瞎趴的四大主題,等你踹共啦!還有機會獲得經典的「偉士牌樂高」喔!馬上來參加本次的活動吧!
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
Thumbnail
「技術分析」分析的就是投資人心理~「系統性風險」下,「基本分析」完全失靈,一點都不要參考 一定要導正你的危機處理觀念。完全失靈因兩大因素: ■人在恐慌情緒下,誰都是本能性思考 □混沌理論跟蝴蝶效應,讓你無法預測 該用「基本分析」是在「寧撈海底死魚,不抓空中飛鳥」時刻,也就是浮現個股長期投資價值時
Thumbnail
反省就是重寫自己的演算法吧? 假設我就是人工智慧,或心智的可以被看作爲人工智慧的編輯器,那我的程式碼是什麼樣的? 從懵懂無知到一無所知,從自以為是到自我消逝,心智只是執行它的內容,我也需要不斷優化。 最好的優化就是簡化。 最能創造財富的演算法就是關於如何除錯與減少任何風險。
本篇文章介紹了一種簡單但正確的評估方法,以投資評估總分和本益比為依據,給出了公司的投資評級,並以臺積電和NVDA作為範例。文章還提到了演算法的重要性,以及執行長數學的思路。建議投資者試用這種投資策略來輔助自己的投資。
Thumbnail
這本由德國作家彼強.莫伊尼創作的《演算人生》,講述了一個近未來的時空中,由公投接受名為「立方體」的演算法人工智慧作為社會系統,所引發的一系列故事。文章對於人工智慧的影響及可能的警示提出了值得深思的看法(這段摘要還是用人工智慧算出來的,真夠諷刺)。
Thumbnail
現在都在探討AI成形後的社會模式 每一個階段的習慣科技都只是為了我們人類的需求很誕生 不過在現階段的認知我認為人類始終能掌控科技 因為 AI人工智能最厲害的是"計算" 而我們人類最厲害的是"算計" "計算"靠的是公式."算計"靠的是想像 有算計的是世界才
Thumbnail
關於這本書,我認為...... 《深度數位大掃除》是一本出乎意料的優質好書。 自從社群媒體、大數據、人工智慧等陸續問世,對於科技如何快速進展,進而滲透人類生活的相關研究已屢見不鮮。原以為這類主題大概是敘述科技對人類生理、心理的負面影響,並提供一些老生常談的方法來杜絕。 但這本書卻提供另一個
Thumbnail
為了讀書會開始認真讀起買了但是放在書架上很久的中國研究相關書籍,挑上這一本就是看上大數據監控的部分。全書談的是中國的監控,而有別於單談新疆的大監控與再教育營,但實際上讀來,就是密度、強度的差異,手法類似,也恐怖莫名。 先從中共政權的槍桿子、筆桿子談起,先是集權的暴力壓迫,少數的族裔還有聲音消音在世
Thumbnail
閱讀筆記《懲罰貧窮:大數據橫行的自動化時代,隱藏在演算法之下的不平等歧視》 謝謝格友偶希都理的分享, 書中這段【授權檢舉者】的內容, 剛好提到這前陣子我曾有的感觸; 為了「真實」了解學生及其家庭的狀況, 就必須真實地「深入訪談」學生及其家庭的生活細節,包含家庭成員的互動,作息,甚至對話,尤
Thumbnail
★看似客觀中立的機器運算,可能在學習人類提供的資料後,再複製社會偏見與歧視,形成「自動不平等」!
前天看了《數值化之鬼》這本書,這本書由識學創辦人安藤廣大撰寫,深入的探討數值化的議題。 在生活與職場上,我們很常很聽到身旁人講數值化思維的重要性,但只有少數人真正理解數值化的真正含義,其中更只有微小的比例能夠真正實踐。 實際上,培養數值化思維並不需要深厚的統計基礎,數值化強調的是「用數字來思考」