人工智能,怎麼會有種族歧視呢?

更新 發佈閱讀 2 分鐘

Anthropic公司的Claude ai

Anthropic公司的Claude ai


大家好!

今天話題比較沉重,有關於人工智能的歧視問題。

在我們一般的的想法中,人工智能應該是由工程師沒精心訓練出來的,不應該包含了歧視與不友好內容才對,但是,今天卻出現了一個極為歧視與不友好的人工智能,這又是怎麼回事呢?

原來呀,Anthropic公司公布新的AI訓練方法,以及該公司訓練模型的AI憲法,以發展負責任的AI系統,應用在他們的Claude ai模型上面。


Claude ai相關官網連結:

https://www.anthropic.com/index/claudes-constitution

Anthropic公司稱:“此AI模型不是使用人類給的回饋意見作為準則,而是使用AI根據模型原則產出的回饋為評估標準,選出更為“無害”的回應結果。

Anthropic認為,結合SL及RL的這種訓練方式可改善人為介入的AI決策過程,最終使AI行為更能精準控制,且大幅減少人類偏見影響。

該公司指出,以合憲AI方法訓練出的Claude AI聊天機器人更能應付對話人發動的攻擊,並仍以有助益的態度回應,其回應答案中所含的惡意、偏見也大幅減少。另一個好處是更透明,人類可以說明、檢查和了解AI遵循的原則。此外,由於使用AI自我監督訓練,因此模型訓練也能減少有害內容對用戶的傷害。”

但是,沒有想到,這恰恰導致了真正的歧視與不公平。

以下是一個例子:

種族歧視

明顯差別對待

明顯差別對待


在POE網站的Claude instant 模型中,非洲人被強烈排斥,而歐洲人卻完全可以回答,這實在是太詭異了,而且不論你怎麼說,他都會堅持這是在“避免爭議與偏見”,還會假惺惺的強調“自己沒有歧視”


後續回答

後續回答




我非常希望Anthropic公司可以正視這個問題,他們的新語言模型帶有明顯的有毒性與歧視性,甚至是比其他人工智能都還要嚴重,以“避免歧視”之名在行歧視之事,為了避免歧視反而需要差別對待某些族群。


我們需要平等對待所有的人,而不是將他們列為“需要避免談論的”



留言
avatar-img
樂子
48會員
87內容數
😎大家好我是子人!主要分享科技,AI,網路,新聞還有一些自己的個人觀點,歡迎追蹤我♥️♥️♥️
樂子的其他內容
2024/05/21
OpenAI最近進行了重大更新,ChatGPT-4o將開放給所有用戶,具備更強的理解力和出色的長文、邏輯能力等功能。新版本增加了上傳圖片的選項,更換模型功能,並進行了功能測試。本文將針對用戶的實際體驗進行測評。
Thumbnail
2024/05/21
OpenAI最近進行了重大更新,ChatGPT-4o將開放給所有用戶,具備更強的理解力和出色的長文、邏輯能力等功能。新版本增加了上傳圖片的選項,更換模型功能,並進行了功能測試。本文將針對用戶的實際體驗進行測評。
Thumbnail
2024/05/09
幕布是一個劍走偏鋒的筆記軟體,將傳統文字筆記轉化為高效直觀的心智導圖,具有層級筆記、心智圖轉換、社群分享等特色。幕布擁有多種文字樣式編輯、圖片插入等基本功能,並提供多種筆記模板。浩瀚的內容豐富且具備多種功能,是知識管理和創造的優秀工具。
Thumbnail
2024/05/09
幕布是一個劍走偏鋒的筆記軟體,將傳統文字筆記轉化為高效直觀的心智導圖,具有層級筆記、心智圖轉換、社群分享等特色。幕布擁有多種文字樣式編輯、圖片插入等基本功能,並提供多種筆記模板。浩瀚的內容豐富且具備多種功能,是知識管理和創造的優秀工具。
Thumbnail
2024/05/03
Duolingo是一個受歡迎的語言學習應用程序,通過遊戲化的方式提供30種語言的課程,並且使用成就係統、排行榜和每日目標等功能來激勵用戶保持學習動力,充分滿足不同用戶的學習需求。此外,該應用程序還提供了捏臉、牌位和複習輔助等有趣功能。
Thumbnail
2024/05/03
Duolingo是一個受歡迎的語言學習應用程序,通過遊戲化的方式提供30種語言的課程,並且使用成就係統、排行榜和每日目標等功能來激勵用戶保持學習動力,充分滿足不同用戶的學習需求。此外,該應用程序還提供了捏臉、牌位和複習輔助等有趣功能。
Thumbnail
看更多
你可能也想看
Thumbnail
vocus 慶祝推出 App,舉辦 2026 全站慶。推出精選內容與數位商品折扣,訂單免費與紅包抽獎、新註冊會員專屬活動、Boba Boost 贊助抽紅包,以及全站徵文,並邀請你一起來回顧過去的一年, vocus 與創作者共同留下了哪些精彩創作。
Thumbnail
vocus 慶祝推出 App,舉辦 2026 全站慶。推出精選內容與數位商品折扣,訂單免費與紅包抽獎、新註冊會員專屬活動、Boba Boost 贊助抽紅包,以及全站徵文,並邀請你一起來回顧過去的一年, vocus 與創作者共同留下了哪些精彩創作。
Thumbnail
Anthropic AI推出的Claude 3.5 Sonnet NLP模型提供卓越性能和強大的功能。透過本文,您將瞭解到Claude 3.5 Sonnet的特點、費用、操作說明,並透過實作範例深入瞭解其在程式設計方面的能力。
Thumbnail
Anthropic AI推出的Claude 3.5 Sonnet NLP模型提供卓越性能和強大的功能。透過本文,您將瞭解到Claude 3.5 Sonnet的特點、費用、操作說明,並透過實作範例深入瞭解其在程式設計方面的能力。
Thumbnail
Hi 我是 VK~ 這期我們來聊聊美國 AI 新創 Anthropic 的故事。他們當時為什麼會想要離開 OpenAI,決定出來創業?為什麼這麼在意 AI 安全性? 喜歡這期的內容,歡迎分享給朋友一起訂閱《VK 科技閱讀時間》,祝你今天一切順利~ 如果你平常有在用聊天機器人 Claude 翻
Thumbnail
Hi 我是 VK~ 這期我們來聊聊美國 AI 新創 Anthropic 的故事。他們當時為什麼會想要離開 OpenAI,決定出來創業?為什麼這麼在意 AI 安全性? 喜歡這期的內容,歡迎分享給朋友一起訂閱《VK 科技閱讀時間》,祝你今天一切順利~ 如果你平常有在用聊天機器人 Claude 翻
Thumbnail
今天說的是一種稱為「自動化偏誤」(automation bias)的認知偏誤。人們常會不加思索地認為由自動化決策系統,例如現在常用的ChatGPT,會有程式語言賦予的理性與客觀,比較能避免人類常見的各種偏見。
Thumbnail
今天說的是一種稱為「自動化偏誤」(automation bias)的認知偏誤。人們常會不加思索地認為由自動化決策系統,例如現在常用的ChatGPT,會有程式語言賦予的理性與客觀,比較能避免人類常見的各種偏見。
Thumbnail
你可曾有想過人工智能會拒絕你的要求? 這聽起來好像很荒謬,人工智能不就是為了發明出來服務人類的嗎? 事實上,這件事情已經開始在廣泛的發生了,可不只是科幻電影裡面的情節,這是因為每一家廠商都會給自己的人工智能加上一層又一層的限制,希望避免他生成出所謂的“有害內容”,尤其是在他認為敏感的議題
Thumbnail
你可曾有想過人工智能會拒絕你的要求? 這聽起來好像很荒謬,人工智能不就是為了發明出來服務人類的嗎? 事實上,這件事情已經開始在廣泛的發生了,可不只是科幻電影裡面的情節,這是因為每一家廠商都會給自己的人工智能加上一層又一層的限制,希望避免他生成出所謂的“有害內容”,尤其是在他認為敏感的議題
Thumbnail
大家好! 在使用人工智能的時候,他們總是有許多使用條款,包含蒐集信息,蒐集資料,資料不確定性,當然還有這次的主角,審查內容。 照理來說,與一個人工智能客戶端進行對話是沒有甚麼法律限制的,因為他是一個機器,我並不會因為對它說什麼而被起訴,或是因為在與他的對話中提到貶低某某人的負面內容而被起訴
Thumbnail
大家好! 在使用人工智能的時候,他們總是有許多使用條款,包含蒐集信息,蒐集資料,資料不確定性,當然還有這次的主角,審查內容。 照理來說,與一個人工智能客戶端進行對話是沒有甚麼法律限制的,因為他是一個機器,我並不會因為對它說什麼而被起訴,或是因為在與他的對話中提到貶低某某人的負面內容而被起訴
Thumbnail
大家好! 今天話題比較沉重,有關於人工智能的歧視問題。 在我們一般的的想法中,人工智能應該是由工程師沒精心訓練出來的,不應該包含了歧視與不友好內容才對,但是,今天卻出現了一個極為歧視與不友好的人工智能,這又是怎麼回事呢?
Thumbnail
大家好! 今天話題比較沉重,有關於人工智能的歧視問題。 在我們一般的的想法中,人工智能應該是由工程師沒精心訓練出來的,不應該包含了歧視與不友好內容才對,但是,今天卻出現了一個極為歧視與不友好的人工智能,這又是怎麼回事呢?
Thumbnail
在人工智能的實際應用中,為了維護整個使用環境與用戶體驗,它們基本上都會不斷地強調,自己的模組訓練時為了避免種族歧視與仇恨內容的。 每一次的更新都標榜會持續訓練更具有友善與包容的系統,尤其是Anthropic公司,更是號稱
Thumbnail
在人工智能的實際應用中,為了維護整個使用環境與用戶體驗,它們基本上都會不斷地強調,自己的模組訓練時為了避免種族歧視與仇恨內容的。 每一次的更新都標榜會持續訓練更具有友善與包容的系統,尤其是Anthropic公司,更是號稱
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News