機器學習裡的歷史偏見:從亞馬遜的招聘到預測性警務,如何避免AI放大社會不公?

更新於 2024/09/17閱讀時間約 3 分鐘

人工智能(AI)和機器學習(ML)正在改變我們生活的方方面面,從購物推薦到醫療診斷,再到犯罪預測。我們常常認為這些技術工具是客觀公正的,能夠幫助我們擺脫人類的偏見和主觀判斷。然而,事實並非如此簡單。


讓我們從一個著名的案例說起。2018年,亞馬遜公司被爆出其招聘AI系統存在性別歧視。這個系統被訓練用來篩選求職者的簡歷,但它學會了偏向男性候選人。原因很簡單:亞馬遜過去10年的招聘數據中,技術崗位大多由男性佔據。AI系統從這些歷史數據中「學習」,認為男性更適合這些崗位。


這就是所謂的「歷史偏見」(Historical Bias)。它源於我們社會長期存在的不平等和歧視,通過數據被ML模型「繼承」下來。即使我們試圖創建一個完全反映現實的數據集,這種偏見仍然會存在。


類似的問題也出現在其他領域。在美國,一些警察部門使用預測性警務(Predictive Policing)系統來預測犯罪熱點。然而,研究表明這些系統往往會將警力過度集中在有色人種社區。原因是這些社區歷史上受到過度警察執法,產生了更多的犯罪記錄數據。AI系統學習這些數據後,就會建議增加這些地區的巡邏,形成一個惡性循環。


(https://www.technologyreview.com/2020/07/17/1005396/predictive-policing-algorithms-racist-dismantled-machine-learning-bias-criminal-justice/)


醫療領域也不能倖免。2019年的一項研究發現,一個被廣泛使用的醫療算法在預測患者的醫療需求時存在種族偏見。該算法使用過去的醫療費用來預測未來的健康風險,但由於非裔美國人平均獲得的醫療資源較少,算法錯誤地認為他們比同等健康狀況的白人患者風險更低。


(https://science.sciencemag.org/content/366/6464/447)


這些案例揭示了ML系統中歷史偏見的危險性。它們不僅複製了過去的不平等,還可能以一種更大規模、更難察覺的方式強化這些不平等。數學家凱西·奧尼爾(Cathy O'Neil)將這種現象稱為「數學毀滅武器」。


那麼,我們該如何應對這個問題呢?


第一步是提高認識。開發和使用ML系統的人員需要意識到歷史偏見的存在,並主動檢測和緩解這些偏見。


其次,我們需要更多元化的數據科學團隊。不同背景的人可以帶來不同的視角,有助於識別和糾正盲點。


在技術層面,研究人員正在開發各種方法來減少偏見。例如,「對抗性去偏見」(Adversarial Debiasing)技術試圖訓練模型在做出預測時「忘記」受保護屬性(如種族或性別)。另一種方法是在訓練數據中平衡不同群體的表示。


(https://arxiv.org/abs/1801.07593)


更重要的是,我們需要建立監管機制。獨立的第三方機構應該對高風險的AI系統進行審計,確保它們符合公平和非歧視的標準。


最後,我們不能忘記人類的判斷和道德考量。ML系統應該是輔助工具,而不是完全取代人類決策。在關鍵決策中,我們仍然需要人類的參與和監督。


歷史偏見是ML領域的一個棘手問題,但它也提醒我們技術的局限性。通過認識這個問題,並採取積極措施來應對,我們才能確保AI真正成為推動社會進步的力量,而不是複製和放大現有的不平等。

    avatar-img
    0會員
    18內容數
    留言0
    查看全部
    avatar-img
    發表第一個留言支持創作者!
    小罗LA的沙龍 的其他內容
    在概率論與統計學的發展長河中,貝葉斯定理與柴普曼-科爾莫戈洛夫方程無疑是兩座里程碑。這兩個看似獨立的數學工具,實則在動態認知系統的研究中產生了深刻的聯繫。本文將探討這種聯繫,並闡述其對現代人工智能和機器學習的啟示。 貝葉斯定理源於18世紀英國數學家托馬斯·貝葉斯的工作。它提供了一種根據先驗知識
    在這個數據驅動的時代,資料視覺化已成為不可或缺的技能。無論是產品開發還是行銷策略,準確而富有洞察力的視覺化呈現都能讓原始數據轉化為可採取行動的見解。然而,許多人在製作資料視覺化時常犯一些錯誤,導致錯誤解讀或誤導受眾。本文將探討10個常見的資料視覺化錯誤,並提供避免這些陷阱的實用建議。 1. 誤
    人工智能時代,企業如何有效利用內部知識庫來增強決策能力?檢索增強生成(RAG)技術為我們提供了一個絕佳的解決方案。本文將深入探討 RAG 的工作原理,並分享 4 個實用策略來優化 RAG 系統,助力企業打造更智能的知識管理體系。 RAG 技術簡介 RAG 技術結合了檢索系統和生成式 AI
    自然語言處理(NLP)領域近年來發展迅速,其中最引人注目的就是Google推出的BERT(Bidirectional Encoder Representations from Transformers)模型。作為一個里程碑式的突破,BERT為我們理解和處理人類語言開闢了新的可能性。 BERT的
    前段時間,JavaScript推出了ES15(ECMAScript 2024)版本,帶來了一系列令人振奮的新特性。作為一名資深JavaScript開發者,我第一時間深入研究了這些新功能,並在實際項目中進行了應用。讓我們一起來看看這些新特性如何改變我們的日常編程體驗。 1. 數組分組功能Obje
    近年來,機器學習和深度學習技術在金融交易領域取得了驚人的進展。本文將深入探討如何利用卷積神經網絡(CNN)模型在加密貨幣市場實現驚人的9,883%回報率。 卷積神經網絡原本是為處理圖像和視頻等網格型數據而設計的,但其強大的特徵提取能力使其同樣適用於時間序列數據分析。在加密貨幣交易中,CNN可以
    在概率論與統計學的發展長河中,貝葉斯定理與柴普曼-科爾莫戈洛夫方程無疑是兩座里程碑。這兩個看似獨立的數學工具,實則在動態認知系統的研究中產生了深刻的聯繫。本文將探討這種聯繫,並闡述其對現代人工智能和機器學習的啟示。 貝葉斯定理源於18世紀英國數學家托馬斯·貝葉斯的工作。它提供了一種根據先驗知識
    在這個數據驅動的時代,資料視覺化已成為不可或缺的技能。無論是產品開發還是行銷策略,準確而富有洞察力的視覺化呈現都能讓原始數據轉化為可採取行動的見解。然而,許多人在製作資料視覺化時常犯一些錯誤,導致錯誤解讀或誤導受眾。本文將探討10個常見的資料視覺化錯誤,並提供避免這些陷阱的實用建議。 1. 誤
    人工智能時代,企業如何有效利用內部知識庫來增強決策能力?檢索增強生成(RAG)技術為我們提供了一個絕佳的解決方案。本文將深入探討 RAG 的工作原理,並分享 4 個實用策略來優化 RAG 系統,助力企業打造更智能的知識管理體系。 RAG 技術簡介 RAG 技術結合了檢索系統和生成式 AI
    自然語言處理(NLP)領域近年來發展迅速,其中最引人注目的就是Google推出的BERT(Bidirectional Encoder Representations from Transformers)模型。作為一個里程碑式的突破,BERT為我們理解和處理人類語言開闢了新的可能性。 BERT的
    前段時間,JavaScript推出了ES15(ECMAScript 2024)版本,帶來了一系列令人振奮的新特性。作為一名資深JavaScript開發者,我第一時間深入研究了這些新功能,並在實際項目中進行了應用。讓我們一起來看看這些新特性如何改變我們的日常編程體驗。 1. 數組分組功能Obje
    近年來,機器學習和深度學習技術在金融交易領域取得了驚人的進展。本文將深入探討如何利用卷積神經網絡(CNN)模型在加密貨幣市場實現驚人的9,883%回報率。 卷積神經網絡原本是為處理圖像和視頻等網格型數據而設計的,但其強大的特徵提取能力使其同樣適用於時間序列數據分析。在加密貨幣交易中,CNN可以
    你可能也想看
    Google News 追蹤
    Thumbnail
    *合作聲明與警語: 本文係由國泰世華銀行邀稿。 證券服務係由國泰世華銀行辦理共同行銷證券經紀開戶業務,定期定額(股)服務由國泰綜合證券提供。   剛出社會的時候,很常在各種 Podcast 或 YouTube 甚至是在朋友間聊天,都會聽到各種市場動態、理財話題,像是:聯準會降息或是近期哪些科
    Thumbnail
    人工智能:革命性技術的崛起與挑戰 1. 什麼是人工智能? 人工智能(AI)是指由人類創造的機器或系統,能夠模仿人類智能,執行通常需要人類智能才能完成的任務。這包括學習、問題解決、語言理解、視覺感知等能力。AI系統可以處理大量數據,識別模式,並根據這些信息做出決策或預測。 2.
    Thumbnail
    文/楊宏文(Hubert) 曾經協助Google打造搜尋及人工智慧業務團隊的約翰.詹南德雷亞 (John Giannandrea) 表示:與其擔心AI淘汰人類,不如先擔心有偏見的AI帶來的社會隱憂。 那麼,什麼是有偏見的AI呢? 請你先打開ChatGPT, Gemini, Copilot或Cl
    Thumbnail
    本文介紹了人工智慧(AI)及機器學習(ML)的基本概念和關係,探討了數據在機器學習中的重要性,以及深度學習和生成式人工智慧的應用。
    Thumbnail
    人工智慧是什麼? 人工智慧(Artificial Intelligence, AI) 簡單來說,就是讓機器模仿人類的思考、學習和決策的能力。它就像是一個聰明的電腦程序,可以執行許多原本需要人類智慧才能完成的工作,例如: 語音辨識: 讓電腦聽懂人類的語言,像是 Siri、Google As
    Thumbnail
    在當今快速發展的技術時代,人工智能 Artificial Intelligence 和機器學習 Machine Learning 已成為推動業務創新和增長的重要力量。從改善客戶服務到優化運營流程,AI和ML的應用範圍日益廣泛,為企業創造出前所未有的機會。企業又可如何利用AI和ML提升業務呢?
    人工智能(AI)对人文社会的影响是一个复杂而深远的话题,涉及到技术、伦理、社会结构和文化变迁等多个方面的考量: AI在技術革新 人工智能(AI)在技术革新方面正发挥着越来越重要的作用,对各行各业都产生了深远影响。以下是AI在技术革新中的几个关键领域: 1. 自动化和智能化: AI技
    Thumbnail
    AI的世界充滿了創新和潛力,涵蓋了許多領域,包括但不限於機器學習,自然語言處理、電腦視覺和機器人技術。AI對人類社會的影響是複雜而多層面的,既帶來了巨大的機遇,也提出了新的挑戰。社會需要在技術發展和倫理規範之間找到平衡,確保AI技術的應用能夠真正造福人類。
    Thumbnail
    自從AI浪潮席捲全世界以後,大家都想知道AI的極限可以到那裡?而隨著AI開始人性化,大家比較擔心的是它的善惡觀是否和人類一致? 因為就人類自身來看,每個人、每個種族、每個國家都有一種自以為是的正義感,總認為自己所做的都是對的,這樣的對錯在AI的量子電腦運算中,到底會呈現什麼樣的結果? 其實最好的
    Thumbnail
    人工智慧系統正在慢慢影響我們的生活,並在不同的產業和產品中得到應用。目前使用的系統大多是基於狹義人工智慧。狹義人工智慧與通用人工智慧有很大不同。 狹義人工智慧的創建是為了專注於特定任務,一個例子就是聊天機器人。
    Thumbnail
    *合作聲明與警語: 本文係由國泰世華銀行邀稿。 證券服務係由國泰世華銀行辦理共同行銷證券經紀開戶業務,定期定額(股)服務由國泰綜合證券提供。   剛出社會的時候,很常在各種 Podcast 或 YouTube 甚至是在朋友間聊天,都會聽到各種市場動態、理財話題,像是:聯準會降息或是近期哪些科
    Thumbnail
    人工智能:革命性技術的崛起與挑戰 1. 什麼是人工智能? 人工智能(AI)是指由人類創造的機器或系統,能夠模仿人類智能,執行通常需要人類智能才能完成的任務。這包括學習、問題解決、語言理解、視覺感知等能力。AI系統可以處理大量數據,識別模式,並根據這些信息做出決策或預測。 2.
    Thumbnail
    文/楊宏文(Hubert) 曾經協助Google打造搜尋及人工智慧業務團隊的約翰.詹南德雷亞 (John Giannandrea) 表示:與其擔心AI淘汰人類,不如先擔心有偏見的AI帶來的社會隱憂。 那麼,什麼是有偏見的AI呢? 請你先打開ChatGPT, Gemini, Copilot或Cl
    Thumbnail
    本文介紹了人工智慧(AI)及機器學習(ML)的基本概念和關係,探討了數據在機器學習中的重要性,以及深度學習和生成式人工智慧的應用。
    Thumbnail
    人工智慧是什麼? 人工智慧(Artificial Intelligence, AI) 簡單來說,就是讓機器模仿人類的思考、學習和決策的能力。它就像是一個聰明的電腦程序,可以執行許多原本需要人類智慧才能完成的工作,例如: 語音辨識: 讓電腦聽懂人類的語言,像是 Siri、Google As
    Thumbnail
    在當今快速發展的技術時代,人工智能 Artificial Intelligence 和機器學習 Machine Learning 已成為推動業務創新和增長的重要力量。從改善客戶服務到優化運營流程,AI和ML的應用範圍日益廣泛,為企業創造出前所未有的機會。企業又可如何利用AI和ML提升業務呢?
    人工智能(AI)对人文社会的影响是一个复杂而深远的话题,涉及到技术、伦理、社会结构和文化变迁等多个方面的考量: AI在技術革新 人工智能(AI)在技术革新方面正发挥着越来越重要的作用,对各行各业都产生了深远影响。以下是AI在技术革新中的几个关键领域: 1. 自动化和智能化: AI技
    Thumbnail
    AI的世界充滿了創新和潛力,涵蓋了許多領域,包括但不限於機器學習,自然語言處理、電腦視覺和機器人技術。AI對人類社會的影響是複雜而多層面的,既帶來了巨大的機遇,也提出了新的挑戰。社會需要在技術發展和倫理規範之間找到平衡,確保AI技術的應用能夠真正造福人類。
    Thumbnail
    自從AI浪潮席捲全世界以後,大家都想知道AI的極限可以到那裡?而隨著AI開始人性化,大家比較擔心的是它的善惡觀是否和人類一致? 因為就人類自身來看,每個人、每個種族、每個國家都有一種自以為是的正義感,總認為自己所做的都是對的,這樣的對錯在AI的量子電腦運算中,到底會呈現什麼樣的結果? 其實最好的
    Thumbnail
    人工智慧系統正在慢慢影響我們的生活,並在不同的產業和產品中得到應用。目前使用的系統大多是基於狹義人工智慧。狹義人工智慧與通用人工智慧有很大不同。 狹義人工智慧的創建是為了專注於特定任務,一個例子就是聊天機器人。