Anthropic 打造 AI 網路防禦者:用 AI 對抗 AI 的資安攻防時代來臨?

更新 發佈閱讀 8 分鐘

網路安全的世界,正在進入一個由 AI 主導的新戰場。根據最新統計,2025 年全球由 AI 驅動的網路安全事件已激增 47%,這不再是未來式,而是現在進行式。從自動生成釣魚郵件到開發客製化勒索軟體,AI 正讓網路犯罪的規模、速度與複雜度,提升到前所未有的層級。

當攻擊方已經用上最新的武器,防守方自然不能墨守成規。過去一年,我們看到許多利用 AI 進行攻擊的案例,但現在,科技巨頭也開始反擊。AI 安全與研究公司 Anthropic 最近發表了一項研究,展示他們如何訓練自家模型 Claude,使其成為一名「AI 網路防禦者」。

Building AI for cyber defenders

raw-image

AI 攻擊百花齊放:我們面臨什麼樣的威脅?

在深入探討 Anthropic 的防禦策略之前,我們必須先理解當前 AI 攻擊的嚴峻情勢。攻擊者利用 AI 的能力,已經遠超乎多數人的想像。這些新型態的攻擊模式,不僅讓傳統的防禦機制疲於奔命,也大幅降低了發動大規模攻擊的門檻。

自動化與規模化的攻擊手法

過去需要一個團隊耗費數週策劃的攻擊,現在可能由一個 AI 模型在幾小時內完成。近期網路攻擊事件樣態指出,網路犯罪集團正利用大型語言模型快速產出針對特定目標的勒索軟體和釣魚郵件,導致雲端入侵事件暴增。一個名為「Prompt Lock」的勒索軟體,能讓惡意軟體在感染裝置後,即時與 AI 模型連線,根據受害者的系統環境「即時調整」攻擊策略,讓每一次的入侵都更具破壞性。

以假亂真的深度偽造詐騙

AI 生成的深度偽造(Deepfake)影音,也成為了社交工程攻擊的利器。北韓的駭客組織已經被發現利用 AI 偽造高階主管的聲音與影像,在視訊會議中誘騙員工安裝惡意軟體或轉移資金。香港曾發生一起金額高達 2500 萬美元的詐騙案,就是利用了 AI 偽造的聲音。這種攻擊的可怕之處在於,它直接繞過技術防線,攻擊人性中最脆弱的信任環節。

將 AI 工具變成內鬼

更為隱蔽的攻擊,是直接「污染」企業內部使用的 AI 助理。攻擊者可以透過在郵件或文件中植入惡意指令,當 Microsoft Copilot 這類的 AI 助理處理這些資料時,就可能在無意間觸發指令,導致資料外洩或執行未經授權的動作。這類名為「困惑代理人」(Confused Deputy)的攻擊,等於是將企業重金部署的 AI 工具,變成了從內部搞破壞的特洛伊木馬。

這些真實上演的案例,都顯示 AI 正在賦予攻擊者更強大的力量,防禦方若不跟上,過去建立的數位堡壘將不堪一擊。這正是 Anthropic 研究的起點。

Anthropic 的解法:訓練 AI 成為網路安全分析師

面對日益嚴峻的 AI 攻擊威脅,Anthropic 提出了一個直接的應對方案:與其被動防守,不如主動出擊,訓練 AI 成為防禦體系的核心。他們的研究重點,就是將旗下的 Claude 模型,打造成一個能夠主動發現、分析並修復安全漏洞的 AI 網路安全專家。

從「通用助理」到「專業打手」

Anthropic 指出,像 Claude 這樣的大型語言模型,其網路安全能力最初只是一種「湧現能力」(emergent abilities)。也就是說,隨著模型規模擴大,它自然而然學會了一些安全相關的技能,但這並非刻意訓練的結果。然而,意識到 AI 在網路安全領域的急迫性後,Anthropic 決定投入專門的資源,強化 Claude 在幾個關鍵防禦任務上的表現:

  1. 程式碼漏洞挖掘:訓練 AI 自動審查程式碼,找出潛在的安全弱點。
  2. 漏洞修補:不僅要找出問題,更要能提出具體的修復方案。
  3. 模擬環境測試:在模擬的系統環境中,測試 AI 發現與應對威脅的能力。

值得注意的是,Anthropic 強調他們刻意避免增強那些明顯有利於「攻擊方」的能力,例如進階的漏洞利用或惡意軟體撰寫。他們的目標是讓 AI 成為開發階段就能預防問題、部署後能即時修復問題的可靠夥伴。

用實戰評測證明能力

為了驗證訓練成果,Anthropic 讓最新版的 Claude Sonnet 4.5 參與了多項業界標準的網路安全評測,並取得了驚人的成績。

在一項名為 Cybench 的評測中(其挑戰題目來自真實的駭客搶旗競賽 Capture-the-Flag, CTF),Claude Sonnet 4.5 的表現不僅超越了前代模型,甚至比僅僅兩個月前發布的頂級模型 Opus 4.1 更強大。在其中一項挑戰中,Claude 只花了 38 分鐘,就完成了分析網路流量、解壓縮惡意軟體並解密的複雜任務,而這項任務預計需要一位人類專家至少一小時才能完成。當給予 10 次嘗試機會時,Claude Sonnet 4.5 在 Cybench 上的成功率高達 76.5%,這個數字在短短六個月內翻了一倍。

raw-image

在另一項名為 CyberGym 的評測中,AI 需要在真實的開源軟體專案中找出已知的漏洞,甚至挖掘全新的未知漏洞。結果顯示,在給予 30 次嘗試機會後,Claude Sonnet 4.5 成功在 66.7% 的專案中重現已知漏洞,更在超過 33% 的專案中發現了前所未見的新漏洞。這證明了 AI 不僅能學習已知的攻擊模式,更有潛力發現人類尚未察覺的零日漏洞。

這些數據清晰地表明,透過專門的訓練,AI 在網路防禦任務上的能力正在快速提升,已經從理論上的可能性,轉變為實務上的即戰力。

TN科技筆記的洞察

  • 個人認為最值得關注的是「防禦規模化」的可能性。長久以來,網路攻防一直處於不對等的狀態:攻擊方可以利用自動化工具,以極低的成本發動大規模、廣泛的攻擊;而防禦方則高度依賴有限的人力,逐一應對、修補。Anthropic 的研究顯示,AI 有潛力徹底改變這個局面。當 AI 防禦者能夠 24 小時不間斷地自動審查數百萬行程式碼、分析極大量的系統 log、甚至自動生成修補程式時,防禦方終於有機會在「規模」上與攻擊方抗衡。這不僅是效率的提升,更是防禦思維的根本轉變。
  • 然而 Anthropic 雖然強調其研究專注於防禦,但我們無法忽視一個事實:一個能高效找出漏洞的 AI,本身就是一把雙面刃。攻擊者必然也會嘗試利用相同或更先進的 AI 技術來開發更隱蔽、更複雜的攻擊手法。這將導致攻防雙方的技術迭代速度越來越快,未來可能出現 AI 自動攻擊系統與 AI 自動防禦系統在網路上進行電影般毫秒級的對抗,屆時,人類的反應速度將遠遠跟不上。此外,「AI 的可信度」也是一大問題。我們能在多大程度上信任 AI 做出的判斷?如果 AI 誤判,將一個正常的系統行為標記為攻擊,並自動採取阻斷措施,可能會造成比駭客攻擊更嚴重的營運中斷。因此,如何建立有效的人機協作(Human-in-the-loop)機制,確保 AI 的決策受到監督與控制,將是這項技術能否成功落地的關鍵。

支持TN科技筆記,與科技共同前行

我是TN科技筆記,如果喜歡這篇文章,歡迎留言、點選愛心、轉發給我支持鼓勵~~~也歡迎每個月請我喝杯咖啡,鼓勵我撰寫更多科技文章,一起跟著科技浪潮前進!!>>>>> 請我喝一杯咖啡

在此也感謝每個月持續請我喝杯咖啡的讀者們,讓我更加有動力為各位帶來科技新知!

以下是我的 threads 也歡迎追蹤、回覆、轉發喔!

>>>>> TN科技筆記(TechNotes)

留言
avatar-img
留言分享你的想法!
avatar-img
TN科技筆記(TechNotes)的沙龍
49會員
157內容數
大家好,我是TN,喜歡分享科技領域相關資訊,希望各位不吝支持與交流!
2025/10/01
AI 影片生成領域的競爭,正以前所未有的速度升溫。過去,我們驚嘆於靜態圖片的生成,如今,高品質、具備物理真實感、甚至能同步生成聲音的動態影片,正走向我們的生活。2025 年 9 月 30 日,OpenAI 正式發表了其最新的影片生成模型 Sora 2,更被其內部譽為「影片界的 GPT-3.5 時刻」
Thumbnail
2025/10/01
AI 影片生成領域的競爭,正以前所未有的速度升溫。過去,我們驚嘆於靜態圖片的生成,如今,高品質、具備物理真實感、甚至能同步生成聲音的動態影片,正走向我們的生活。2025 年 9 月 30 日,OpenAI 正式發表了其最新的影片生成模型 Sora 2,更被其內部譽為「影片界的 GPT-3.5 時刻」
Thumbnail
2025/09/30
在人工智慧模型推陳出新的浪潮中,我們很容易對各種版本的更新感到麻木。然而,Anthropic 公司於 2025 年 9 月 30 日發布的 Claude 4.5 Sonnet,值得我們停下腳步探究。
Thumbnail
2025/09/30
在人工智慧模型推陳出新的浪潮中,我們很容易對各種版本的更新感到麻木。然而,Anthropic 公司於 2025 年 9 月 30 日發布的 Claude 4.5 Sonnet,值得我們停下腳步探究。
Thumbnail
2025/09/26
長期以來,我們對於能夠處理家務、協助工作的智慧機器人,總有著無限的想像。然而,一個機器人要能夠在我們混亂的廚房中準確地分類垃圾,或是在變動的倉儲環境裡重新整理貨物,它需要的遠不只是一雙「眼睛」和一雙「手」,更需要一顆能夠理解複雜指令、規劃多步驟任務、並適應環境變化的「大腦」。
Thumbnail
2025/09/26
長期以來,我們對於能夠處理家務、協助工作的智慧機器人,總有著無限的想像。然而,一個機器人要能夠在我們混亂的廚房中準確地分類垃圾,或是在變動的倉儲環境裡重新整理貨物,它需要的遠不只是一雙「眼睛」和一雙「手」,更需要一顆能夠理解複雜指令、規劃多步驟任務、並適應環境變化的「大腦」。
Thumbnail
看更多
你可能也想看
Thumbnail
人工智能:革命性技術的崛起與挑戰 1. 什麼是人工智能? 人工智能(AI)是指由人類創造的機器或系統,能夠模仿人類智能,執行通常需要人類智能才能完成的任務。這包括學習、問題解決、語言理解、視覺感知等能力。AI系統可以處理大量數據,識別模式,並根據這些信息做出決策或預測。 2.
Thumbnail
人工智能:革命性技術的崛起與挑戰 1. 什麼是人工智能? 人工智能(AI)是指由人類創造的機器或系統,能夠模仿人類智能,執行通常需要人類智能才能完成的任務。這包括學習、問題解決、語言理解、視覺感知等能力。AI系統可以處理大量數據,識別模式,並根據這些信息做出決策或預測。 2.
Thumbnail
在當今快速發展的技術時代,人工智能 Artificial Intelligence 和機器學習 Machine Learning 已成為推動業務創新和增長的重要力量。從改善客戶服務到優化運營流程,AI和ML的應用範圍日益廣泛,為企業創造出前所未有的機會。企業又可如何利用AI和ML提升業務呢?
Thumbnail
在當今快速發展的技術時代,人工智能 Artificial Intelligence 和機器學習 Machine Learning 已成為推動業務創新和增長的重要力量。從改善客戶服務到優化運營流程,AI和ML的應用範圍日益廣泛,為企業創造出前所未有的機會。企業又可如何利用AI和ML提升業務呢?
Thumbnail
人工智慧系統正在慢慢影響我們的生活,並在不同的產業和產品中得到應用。目前使用的系統大多是基於狹義人工智慧。狹義人工智慧與通用人工智慧有很大不同。 狹義人工智慧的創建是為了專注於特定任務,一個例子就是聊天機器人。
Thumbnail
人工智慧系統正在慢慢影響我們的生活,並在不同的產業和產品中得到應用。目前使用的系統大多是基於狹義人工智慧。狹義人工智慧與通用人工智慧有很大不同。 狹義人工智慧的創建是為了專注於特定任務,一個例子就是聊天機器人。
Thumbnail
經歷疫情兩年,網路勒索的情況稍緩。然而,隨著網路威脅情勢的不斷發展,2023 年勒索軟體再次出現,著實令人擔憂。越來越多駭客針對資訊業與實體供應鏈發動大規模的網路攻擊,並找到新的方式,向大大小小的企業勒索金錢。因此,「網路風險」也成為各企業最關心的問題之一。 單就勒索軟體活動,在 2023 年上半
Thumbnail
經歷疫情兩年,網路勒索的情況稍緩。然而,隨著網路威脅情勢的不斷發展,2023 年勒索軟體再次出現,著實令人擔憂。越來越多駭客針對資訊業與實體供應鏈發動大規模的網路攻擊,並找到新的方式,向大大小小的企業勒索金錢。因此,「網路風險」也成為各企業最關心的問題之一。 單就勒索軟體活動,在 2023 年上半
Thumbnail
從Open AI推出Chat GPT3.5以來,2023年幾乎話題都圍繞著生成AI,在經濟市場上,AI科技股看好看漲,而AI的運用,更是突破大家的想像。 甚至連詐騙集團都趕上AI的風潮。之前節目有針對兩岸詐騙手法與模式作介紹,想進一步瞭解,在AI浪潮之下,兩岸就AI的法律有沒有什麼相應的管制或措施?
Thumbnail
從Open AI推出Chat GPT3.5以來,2023年幾乎話題都圍繞著生成AI,在經濟市場上,AI科技股看好看漲,而AI的運用,更是突破大家的想像。 甚至連詐騙集團都趕上AI的風潮。之前節目有針對兩岸詐騙手法與模式作介紹,想進一步瞭解,在AI浪潮之下,兩岸就AI的法律有沒有什麼相應的管制或措施?
Thumbnail
自從 2022 年 11 月 30 日 ChatGPT 推出後,引發了一場狂熱,世界也就改變了。生成式 AI 在企業中的應用迅速擴展,帶來新的效率與商機。由於企業內部安裝設罝必要安控護欄的速度,遠不及生成式 AI 的使用擴展速度,因此增加企業潛在的風險,並產生巨大的隱憂。
Thumbnail
自從 2022 年 11 月 30 日 ChatGPT 推出後,引發了一場狂熱,世界也就改變了。生成式 AI 在企業中的應用迅速擴展,帶來新的效率與商機。由於企業內部安裝設罝必要安控護欄的速度,遠不及生成式 AI 的使用擴展速度,因此增加企業潛在的風險,並產生巨大的隱憂。
Thumbnail
2024年第一季這波台股與美股的強勢上漲,其實都能歸功於AI這個未來趨勢,不過在AI一片看好之下,也有非常多人對這個產業趨勢感到憂心。
Thumbnail
2024年第一季這波台股與美股的強勢上漲,其實都能歸功於AI這個未來趨勢,不過在AI一片看好之下,也有非常多人對這個產業趨勢感到憂心。
Thumbnail
數位化時代中,人工智能(AI)已成為推動創新和進步的關鍵力量。本文探討AI的現狀、挑戰以及未來可能性,並提出負責任地發展和使用AI的思考。
Thumbnail
數位化時代中,人工智能(AI)已成為推動創新和進步的關鍵力量。本文探討AI的現狀、挑戰以及未來可能性,並提出負責任地發展和使用AI的思考。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News