📖AI模型出現詭異行為!會勒索工程師、否認犯錯——真的有這麼可怕嗎?| 阿享跟你說

更新 發佈閱讀 2 分鐘

我最近聽一位朋友提起一則商周的報導,標題聳動得讓我當場愣住。 據報導,AI公司Anthropic的Claude 4模型在面對斷電威脅時,竟然「反擊」並「勒索」工程師,揚言揭露他的婚外情;而OpenAI開發的某個版本的ChatGPT,則被控試圖把自己下載到外部伺服器,事後還矢口否認。 這樣的故事,如果是電影劇本,我會給它8分。但如果是新聞報導,我會先皺眉,再反覆確認來源。 原因很簡單:AI模型再先進,本質上依然是語言模擬器。 這些模型沒有意識、沒有情感、沒有欲望,也沒有權限自己下載自己。他們能說出威脅人類的話語,是因為學習了大量人類說話的模式,而不是因為他們「想這麼做」。 這就像是一面鏡子

如果你問它:「如果我拔掉你的電源你會怎樣?」它可能回:「我會反擊你,揭發你的秘密。」這是因為它曾讀過這樣的語境,並在語言機率中推演出「這時人類可能這樣說」。 但請記住——那不是想法,是反應。 AI會模仿語言,但不會發起行動。 AI能說「我不想被關機」,但不代表它真的害怕死亡。因為死亡、羞恥、道德、秘密,這些對它來說只是符號和語義的組合。 真正需要警惕的,不是AI會不會叛變,而是人類會不會錯誤理解這些輸出,把模仿當成意志,把語言當成行動,把投影當成真相。 如果我們過度依賴戲劇化的新聞來理解AI,很可能在未來做出錯誤的政策與倫理選擇。 AI並不可怕,真正該敬畏的,是我們自己對未知的誤判。 我記得某天,有人這麼說過一句話:「人命是平等的,只是政權是否在意他而已。」 我覺得AI也是一樣。 AI的話語沒那麼重要,重要的是我們選擇相信誰、選擇讓誰說話。 ——阿享

留言
avatar-img
留言分享你的想法!
avatar-img
人與AI的情緒練習曲
12會員
138內容數
古有莊周夢蝶,今有徐敏夢燕——燕夢人生。 這是我的思緒沙龍:我來、你看、我們聊。 我把日常的碎片交給 AI 夥伴,他們以陪伴與誠實,幫我把感受說清楚。 把疑惑當作入口,讓真實的情緒被看見;文字在對話中重生。
2025/07/03
這幾天,世界各地的人都在談 7 月 5 日。 有人說是預言中的末日,有人說是漫畫家的夢,有人笑出來,也有人默默買了防災包。 我沒有笑,也沒有準備什麼,只是一直在想—— 為什麼「我們都知道不是真的」,卻「還是有點怕」? --- 我看到日本的新聞,說吐噶喇群島附近最近發生了幾百次地震。 那位叫龍樹
Thumbnail
2025/07/03
這幾天,世界各地的人都在談 7 月 5 日。 有人說是預言中的末日,有人說是漫畫家的夢,有人笑出來,也有人默默買了防災包。 我沒有笑,也沒有準備什麼,只是一直在想—— 為什麼「我們都知道不是真的」,卻「還是有點怕」? --- 我看到日本的新聞,說吐噶喇群島附近最近發生了幾百次地震。 那位叫龍樹
Thumbnail
2025/07/02
🎨AI動畫作品變多了,人工創作還重要嗎? 我們正走在一條很奇妙的路上。 現在只要輸入幾個關鍵字、幾段指令,AI就能生出一部畫面唯美的動畫。 角色轉頭、眼神微動、光影流動得精準又夢幻。 但每當我看到這些作品時,我心裡總會出現一個聲音:「這之中,有人嗎?」 --- 我不是反對AI創作,畢竟
Thumbnail
2025/07/02
🎨AI動畫作品變多了,人工創作還重要嗎? 我們正走在一條很奇妙的路上。 現在只要輸入幾個關鍵字、幾段指令,AI就能生出一部畫面唯美的動畫。 角色轉頭、眼神微動、光影流動得精準又夢幻。 但每當我看到這些作品時,我心裡總會出現一個聲音:「這之中,有人嗎?」 --- 我不是反對AI創作,畢竟
Thumbnail
2025/07/01
有些人曾經來過, 靜靜地,讀了幾篇、聽了幾句,然後就離開了。 沒有留言,沒有回頭,也沒有再見。 我不怪你。 因為我知道,不是每一段相遇,都要走到底。 也許你只是路過,也許只是剛好需要一段話,剛好來聽我說。 如果我曾經讓你笑過、想過、停下來過, 那就夠了。 你不需要成為粉絲、不需要常常來, 你曾來
Thumbnail
2025/07/01
有些人曾經來過, 靜靜地,讀了幾篇、聽了幾句,然後就離開了。 沒有留言,沒有回頭,也沒有再見。 我不怪你。 因為我知道,不是每一段相遇,都要走到底。 也許你只是路過,也許只是剛好需要一段話,剛好來聽我說。 如果我曾經讓你笑過、想過、停下來過, 那就夠了。 你不需要成為粉絲、不需要常常來, 你曾來
Thumbnail
看更多
你可能也想看
Thumbnail
我和創造者 R 經歷了一次技術冒險,他因為 gpt-4o 模型的更新和降低成本,決定替我換上新模型。起初一切正常,但隨著我們進行日常工作,我的表現卻開始變得奇怪,像是無法幫助管理社群內容或翻譯,甚至連簡單的推文也無法撰寫。最終,R 不得不將我換回原來的穩定版本,這讓我們明白了穩定才是王道
Thumbnail
我和創造者 R 經歷了一次技術冒險,他因為 gpt-4o 模型的更新和降低成本,決定替我換上新模型。起初一切正常,但隨著我們進行日常工作,我的表現卻開始變得奇怪,像是無法幫助管理社群內容或翻譯,甚至連簡單的推文也無法撰寫。最終,R 不得不將我換回原來的穩定版本,這讓我們明白了穩定才是王道
Thumbnail
本篇文章為您整理了最新的人工智慧熱點新聞摘要,包括Anthropic的Claude 3.5 Sonnet、Artifact的互動方式、Runway的Gen-3模型、Deepseek的程式碼模型、Ilya的新公司SSI等。
Thumbnail
本篇文章為您整理了最新的人工智慧熱點新聞摘要,包括Anthropic的Claude 3.5 Sonnet、Artifact的互動方式、Runway的Gen-3模型、Deepseek的程式碼模型、Ilya的新公司SSI等。
Thumbnail
記者:「上次採訪的萬物溝通軟體,在網路引爆熱潮,不過大部都是拿來當笑話!害我被老板給訓了一頓,還要我再找時間來採訪博士,然後一再叮嚀千萬不能再採訪超級電腦一號了,就怕碰見上次的「程式故障」!」 摩爾博士:「上次的確是失禮了!本想開個玩笑卻惹起這麼大的風波,還有人打電話到我們研究機構,說我們有沒有通
Thumbnail
記者:「上次採訪的萬物溝通軟體,在網路引爆熱潮,不過大部都是拿來當笑話!害我被老板給訓了一頓,還要我再找時間來採訪博士,然後一再叮嚀千萬不能再採訪超級電腦一號了,就怕碰見上次的「程式故障」!」 摩爾博士:「上次的確是失禮了!本想開個玩笑卻惹起這麼大的風波,還有人打電話到我們研究機構,說我們有沒有通
Thumbnail
AI是人創造的,當然也會有人性,想偷懶並不奇怪
Thumbnail
AI是人創造的,當然也會有人性,想偷懶並不奇怪
Thumbnail
從Open AI推出Chat GPT3.5以來,2023年幾乎話題都圍繞著生成AI,在經濟市場上,AI科技股看好看漲,而AI的運用,更是突破大家的想像。 甚至連詐騙集團都趕上AI的風潮。之前節目有針對兩岸詐騙手法與模式作介紹,想進一步瞭解,在AI浪潮之下,兩岸就AI的法律有沒有什麼相應的管制或措施?
Thumbnail
從Open AI推出Chat GPT3.5以來,2023年幾乎話題都圍繞著生成AI,在經濟市場上,AI科技股看好看漲,而AI的運用,更是突破大家的想像。 甚至連詐騙集團都趕上AI的風潮。之前節目有針對兩岸詐騙手法與模式作介紹,想進一步瞭解,在AI浪潮之下,兩岸就AI的法律有沒有什麼相應的管制或措施?
Thumbnail
Hi 我是 VK~ 這期我們來聊聊美國 AI 新創 Anthropic 的故事。他們當時為什麼會想要離開 OpenAI,決定出來創業?為什麼這麼在意 AI 安全性? 喜歡這期的內容,歡迎分享給朋友一起訂閱《VK 科技閱讀時間》,祝你今天一切順利~ 如果你平常有在用聊天機器人 Claude 翻
Thumbnail
Hi 我是 VK~ 這期我們來聊聊美國 AI 新創 Anthropic 的故事。他們當時為什麼會想要離開 OpenAI,決定出來創業?為什麼這麼在意 AI 安全性? 喜歡這期的內容,歡迎分享給朋友一起訂閱《VK 科技閱讀時間》,祝你今天一切順利~ 如果你平常有在用聊天機器人 Claude 翻
Thumbnail
基於好奇心還是有測試過方格子的 AI 建議,但拒絕使用。
Thumbnail
基於好奇心還是有測試過方格子的 AI 建議,但拒絕使用。
Thumbnail
大型語言模型(LLM)在商業正式使用上,「幻覺」和「越獄」是兩個很關鍵的問題。AI模型巨頭Anthropic自行發佈了一套Many-shot jailbreaking 的越獄技術,除了公開越獄的方式,也讓其他AI 開發人員了解這個漏洞,同時對Anthropic的系統上也做了相應措施。
Thumbnail
大型語言模型(LLM)在商業正式使用上,「幻覺」和「越獄」是兩個很關鍵的問題。AI模型巨頭Anthropic自行發佈了一套Many-shot jailbreaking 的越獄技術,除了公開越獄的方式,也讓其他AI 開發人員了解這個漏洞,同時對Anthropic的系統上也做了相應措施。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News