方格精選

讀書誌:《大數據的傲慢與偏見:一個「圈內數學家」對演算法霸權的警告與揭發》

閱讀時間約 5 分鐘
這本所謂「大數據」著作(《偏見》),主要內容是關注隱藏在我們四周的「演算法」,中文副題《一個「圈內數學家」對演算法霸權的警告與揭發》反而清楚指出著作內容。雖然有點感到「被騙」,也許側面印證「大數據」一詞具有盈利潛力,總要沾一沾。《偏見》內容很少涉及大數據,但專注演算法;尤其所謂「演算法霸權」,亦值得一讀。
為何選讀這類書籍?到處都在追捧大數據,大量「讓我告訴你成功運用大數據盈利的秘訣」書籍充斥市面,總是讓筆者嗅到那種「騙徒」的體臭。單憑直覺定罪不太公允,惟有篩走大量「發大財秘訣」讀本,先讀一些揭大數據瘡疤的作品,以備應對市面種種對大數據的歌功頌德。當然,可能令筆者矯枉過正,倒向另一個偏頗。
數學毀滅性武器 WMD
作者Cathy O'Neil從事與數據演算法有關的工作,故此多年來撰文指出種種問題。英文書名《Weapons of Math Destruction》,中文版譯作「數學毀滅性武器」。翻譯提醒讀者:「大殺傷力武器」(Weapon of Mass Destruction)的英文首字縮寫,恰巧都是WMD(21頁),似乎作者是故意為之,突顯現存的演算法弊端,並對人造成的廣泛傷害。
對甚麼人造成何種傷害?
書中談及的「演算法」,並非鬧得熱烘烘的Facebook或YouTube演算法,而是藏身於眾多電腦系統之中的數學模型。這些數學模型協助管理層作出日常決策,涵蓋教育、推廣銷售、銀行、保險、治安、求職、大學排名等等。這些工作本來由「人」擔任、做判斷,現在由電腦代勞,好處「多不勝數」:可以更快、更準確、更長時間(24/7 support)、更客觀(冷血/無情)、處理更大量資料。
然而,電腦和數學模型如何像「人」一般,去觀察、了解、查證另一個「人」?現階段AI仍未懂得認識、摸透一個人,像「人」一般對人評頭品足,但21世紀的資訊網絡及社交媒體,存放了大量我們的資料,在其中勤奮發掘(所謂的data mining),總有得著。
如何發掘?選取一個幫助我們對人作出判斷的「替代指標」,並靠賴數學模型中的「演算法」。《偏見》透過不同章節,分析「替代指標」如何錯誤標籤一個人,「演算法」如何錯誤運用資料,製作「替代指標」。兩者是合謀共犯,雙劍合壁之下就會出現極其荒謬的局面,例如如何評估客戶,分辨出他們是潛在的「豪客」或可以忽略的「窮光蛋」?由於不少個人信用/信貸/財務資料仍屬私隱,未能「隨意方便」取得,於是退而求其次,尋找/挖掘一些較少規管的資料,諸如點擊記錄、定位數據、郵遞區號等等(162-164頁),用作估算「替代指標」。於是,你在甚麼地方使用網絡(是否豪宅區或非裔、墨西哥裔聚居地)?閣下曾否瀏覽奢侈品網站?你居住的區域拖欠信用卡還款的比率高嗎?
既然如此,只要我不希罕「豪客」這個身份,「演算法」對我就無可奈何?且別高興得太早。《偏見》提及一些案例,經濟環境欠佳的人,更多在網絡搜尋有關政府援助的資料。既然知道這類人「有困難」,結果就讓你看見更多與「貸款」有關的網絡廣告,作者用的字眼是:他們”….令自己成為「掠奪」的目標….”(224頁)。
還有相似的案例。有些演算法/替代指標會認為:花時間看條款細則、正確填寫申請表的人,比較守規則,「信用」應較好。然而新移民、教育程度較低的人,填寫各種申請表時,拼寫及標點運用出錯機會較高,會被演算法視為「風險」一族,需要收取較高的借貸利息。這裡出現一個惡性循環:這類人士本來在借貸市場已經沒有優勢,高昂利率令他們拖欠還款機會增加,進一步強化這個演算法/替代指標的「自信」(176頁)。《偏見》還引述更多惡劣的例子,涵蓋前文提及的生活領域。
美國社會對此並非一無所知,為何多間機構仍繼續讓這種演算法運作下去,不願作出改善?
因為盈利。大機構使用演算法及替代指標,首要目的是改善盈利,財務報表既然報捷,目標已達;加上這演算法「苦主/受害人」並非他們心儀的「豪客」們,何解要節外生枝?若非「圈內數學家」(作者)及部份受害人喧嘩煩擾,恐怕會不了了之。
然而,政府機構也在使用演算法,他們也在追求盈利嗎?政府機構未必追求盈利,卻在意政績。在談及執法、治安問題一段,政府政績就是罪案減少,但背後的代價是甚麼?是更多非裔/拉丁裔居民,因為演算法的「助攻」被捕及入獄?但其他同樣犯法的較富裕白人呢(104-122頁) ?《偏見》在2017年出版,但仍可幫助我們了解多一點George Floyd案件的社會背景及氛圍。
「公平」一點,電腦不懂思考,會思考、留意公平與否的是人腦,電腦、演算法、替代指標「該當何罪」?締造一個公正幸福社會,不能依賴電腦和演算法,如作者所言:
“….數學毀滅性武器傾向重視效能……但公平是個含糊和難以量化的概念……因此,數學毀滅性武器不考慮公平問題。結果它們大規模地製造出不公平的情況….”(114頁)
資訊科技總會為全人類帶來美好將來?視乎你指涉的是「誰」的將來。《偏見》提醒大家,若果你不是「豪客」們,這個美好將來可能與你無關。
北望神州,我們看見更先進、更有效率的社會信用評分體制(1),大家感到幸福、美好嗎?
註:
(1) 《【中國社會信用評分】大數據打撃無賴成未來監獄?即計你有幾分》 (香港01 10/7/2019) https://www.hk01.com/數碼生活/350379/中國社會信用評分-大數據打撃無賴成未來監獄-即計你有幾分
為什麼會看到廣告
29會員
130內容數
留言0
查看全部
發表第一個留言支持創作者!
關間聞的沙龍 的其他內容
第一次看見書本名稱,以為是印刷出錯:1873-1898?才廿多年,梁啟超(1873-1929)不是如此「短命」嗎?後來知道《青年變革者 : 梁啟超 1873-1898》(《梁啟超》)是作者的三部曲巨構(自序第5頁)的第一部,涵括梁啟超出生至1898年間的人生足跡與事業作為,已經是超過380頁的磚頭書
有甚麼不能穿鑿附會到「國家安全」嗎?日後《國安法》實施,恐怕會以國家安全為由,壓倒無罪推定,寧枉毋縱,造成冤案連連。
兩個時代的作者,都深愛這個城市,或察覺城市的陰暗,為之著急;或憂患民間的淪喪,為之立志。
將來唱一首香港的歌,恐怕只能仿傚《一起》,一字不提這塊土地,惟靠心領神會。
《極》的社會觸角,毫無疑問超越不少昔日及同期作品。
《曾路得+四月之聲》與後來的《赤道》都是先行者,設身處地,我們不一定比他們更出色。
第一次看見書本名稱,以為是印刷出錯:1873-1898?才廿多年,梁啟超(1873-1929)不是如此「短命」嗎?後來知道《青年變革者 : 梁啟超 1873-1898》(《梁啟超》)是作者的三部曲巨構(自序第5頁)的第一部,涵括梁啟超出生至1898年間的人生足跡與事業作為,已經是超過380頁的磚頭書
有甚麼不能穿鑿附會到「國家安全」嗎?日後《國安法》實施,恐怕會以國家安全為由,壓倒無罪推定,寧枉毋縱,造成冤案連連。
兩個時代的作者,都深愛這個城市,或察覺城市的陰暗,為之著急;或憂患民間的淪喪,為之立志。
將來唱一首香港的歌,恐怕只能仿傚《一起》,一字不提這塊土地,惟靠心領神會。
《極》的社會觸角,毫無疑問超越不少昔日及同期作品。
《曾路得+四月之聲》與後來的《赤道》都是先行者,設身處地,我們不一定比他們更出色。
你可能也想看
Google News 追蹤
Thumbnail
接下來第二部分我們持續討論美國總統大選如何佈局, 以及選前一週到年底的操作策略建議 分析兩位候選人政策利多/ 利空的板塊和股票
Thumbnail
🤔為什麼團長的能力是死亡筆記本? 🤔為什麼像是死亡筆記本呢? 🤨作者巧思-讓妮翁死亡合理的幾個伏筆
Thumbnail
對於一般台灣民眾而言,「性」從來都令人難以啟齒,儘管偶爾會出現過度誇大的性能力話題,對於「性」或許大部分的人都是一知半解。然而,比起行為本身,「性」同時建構在一個人如何面對關係的基礎上,甚至能夠反映當下的心理狀態,因此如何正視「性」的意義,或許是所有不分年齡層的人,都必須開始學習的重點課題。
Thumbnail
【從《風之谷》到《輝耀姬物語》──關於吉卜力,你可能不知道的10件厲害的事 2021.8.1 新書發表線上活動 側記】 今年做《天才的思考:高畑勳與宮崎駿》這本書的時候,發現《秋刀魚》和《釀電影》兩位「前輩」在四、五月已經出了分別針對吉卜力、宮崎駿的專刊......
Thumbnail
在這篇文章中,我會簡要分享關於數據思維,以及從零到一,建立數據思維、分析與應用的參考書單。有不足與建議之處,也歡迎提出討論!
Thumbnail
以「被遺忘的『台灣元素』」作為副標,對於《老屋顏與鐵窗花》這本作品而言是再合適不過的。包含宗教、社會經濟發展、常民的共同認知及生活經驗,鐵窗花不只守護了台灣人民的居家安全,也紀錄下了最寫實的常民樣態。
Thumbnail
信宏在現實生活中,真的有個粉絲專頁,也時常上傳溫暖的家庭照。雲端的明亮對比筆下的慘然無光,讀者的窺伺慾望被猛烈地勾起,跟著融入眼前這場名為日常的大戲。
Thumbnail
好久以前,曾有人問我,夏目漱石的作品最喜歡哪一本呢? 當時的我其實答不太出來,一方面是因為夏目的書雖然都蠻好看的,但性質其實都非常相像。劇情常常在重複,或很類似。書寫的主題更不用說總是常常圍繞愛情婚姻的苦惱,以及人生的孤獨、寂寞。唯一想到較特別的,是《我是貓》。但有趣的是,要說自己最喜歡的作品是《我
Thumbnail
《秘密》,截自博客來。 谷崎潤一郎的《秘密》,是2020年新雨出版社新譯出版的短篇小說集。不知是不是因為推理文學的熱潮,所以近年來很多作家的書只要和犯罪有關,在宣傳上就容易和「推理」這一詞產生連結。讓筆者在觀覽封面時意外了一下,想不到谷崎竟然也有寫「推理小說」,而興奮地拿來翻閱。
Thumbnail
接下來第二部分我們持續討論美國總統大選如何佈局, 以及選前一週到年底的操作策略建議 分析兩位候選人政策利多/ 利空的板塊和股票
Thumbnail
🤔為什麼團長的能力是死亡筆記本? 🤔為什麼像是死亡筆記本呢? 🤨作者巧思-讓妮翁死亡合理的幾個伏筆
Thumbnail
對於一般台灣民眾而言,「性」從來都令人難以啟齒,儘管偶爾會出現過度誇大的性能力話題,對於「性」或許大部分的人都是一知半解。然而,比起行為本身,「性」同時建構在一個人如何面對關係的基礎上,甚至能夠反映當下的心理狀態,因此如何正視「性」的意義,或許是所有不分年齡層的人,都必須開始學習的重點課題。
Thumbnail
【從《風之谷》到《輝耀姬物語》──關於吉卜力,你可能不知道的10件厲害的事 2021.8.1 新書發表線上活動 側記】 今年做《天才的思考:高畑勳與宮崎駿》這本書的時候,發現《秋刀魚》和《釀電影》兩位「前輩」在四、五月已經出了分別針對吉卜力、宮崎駿的專刊......
Thumbnail
在這篇文章中,我會簡要分享關於數據思維,以及從零到一,建立數據思維、分析與應用的參考書單。有不足與建議之處,也歡迎提出討論!
Thumbnail
以「被遺忘的『台灣元素』」作為副標,對於《老屋顏與鐵窗花》這本作品而言是再合適不過的。包含宗教、社會經濟發展、常民的共同認知及生活經驗,鐵窗花不只守護了台灣人民的居家安全,也紀錄下了最寫實的常民樣態。
Thumbnail
信宏在現實生活中,真的有個粉絲專頁,也時常上傳溫暖的家庭照。雲端的明亮對比筆下的慘然無光,讀者的窺伺慾望被猛烈地勾起,跟著融入眼前這場名為日常的大戲。
Thumbnail
好久以前,曾有人問我,夏目漱石的作品最喜歡哪一本呢? 當時的我其實答不太出來,一方面是因為夏目的書雖然都蠻好看的,但性質其實都非常相像。劇情常常在重複,或很類似。書寫的主題更不用說總是常常圍繞愛情婚姻的苦惱,以及人生的孤獨、寂寞。唯一想到較特別的,是《我是貓》。但有趣的是,要說自己最喜歡的作品是《我
Thumbnail
《秘密》,截自博客來。 谷崎潤一郎的《秘密》,是2020年新雨出版社新譯出版的短篇小說集。不知是不是因為推理文學的熱潮,所以近年來很多作家的書只要和犯罪有關,在宣傳上就容易和「推理」這一詞產生連結。讓筆者在觀覽封面時意外了一下,想不到谷崎竟然也有寫「推理小說」,而興奮地拿來翻閱。