Anthropic 打造 AI 網路防禦者：用 AI 對抗 AI 的資安攻防時代來臨？

2025/10/05 更新2025/10/05 發佈閱讀 8 分鐘

網路安全的世界，正在進入一個由 AI 主導的新戰場。根據最新統計，2025 年全球由 AI 驅動的網路安全事件已激增 47%，這不再是未來式，而是現在進行式。從自動生成釣魚郵件到開發客製化勒索軟體，AI 正讓網路犯罪的規模、速度與複雜度，提升到前所未有的層級。

當攻擊方已經用上最新的武器，防守方自然不能墨守成規。過去一年，我們看到許多利用 AI 進行攻擊的案例，但現在，科技巨頭也開始反擊。AI 安全與研究公司 Anthropic 最近發表了一項研究，展示他們如何訓練自家模型 Claude，使其成為一名「AI 網路防禦者」。

Building AI for cyber defenders

AI 攻擊百花齊放：我們面臨什麼樣的威脅？

在深入探討 Anthropic 的防禦策略之前，我們必須先理解當前 AI 攻擊的嚴峻情勢。攻擊者利用 AI 的能力，已經遠超乎多數人的想像。這些新型態的攻擊模式，不僅讓傳統的防禦機制疲於奔命，也大幅降低了發動大規模攻擊的門檻。

自動化與規模化的攻擊手法

過去需要一個團隊耗費數週策劃的攻擊，現在可能由一個 AI 模型在幾小時內完成。近期網路攻擊事件樣態指出，網路犯罪集團正利用大型語言模型快速產出針對特定目標的勒索軟體和釣魚郵件，導致雲端入侵事件暴增。一個名為「Prompt Lock」的勒索軟體，能讓惡意軟體在感染裝置後，即時與 AI 模型連線，根據受害者的系統環境「即時調整」攻擊策略，讓每一次的入侵都更具破壞性。

以假亂真的深度偽造詐騙

AI 生成的深度偽造（Deepfake）影音，也成為了社交工程攻擊的利器。北韓的駭客組織已經被發現利用 AI 偽造高階主管的聲音與影像，在視訊會議中誘騙員工安裝惡意軟體或轉移資金。香港曾發生一起金額高達 2500 萬美元的詐騙案，就是利用了 AI 偽造的聲音。這種攻擊的可怕之處在於，它直接繞過技術防線，攻擊人性中最脆弱的信任環節。

將 AI 工具變成內鬼

更為隱蔽的攻擊，是直接「污染」企業內部使用的 AI 助理。攻擊者可以透過在郵件或文件中植入惡意指令，當 Microsoft Copilot 這類的 AI 助理處理這些資料時，就可能在無意間觸發指令，導致資料外洩或執行未經授權的動作。這類名為「困惑代理人」（Confused Deputy）的攻擊，等於是將企業重金部署的 AI 工具，變成了從內部搞破壞的特洛伊木馬。

這些真實上演的案例，都顯示 AI 正在賦予攻擊者更強大的力量，防禦方若不跟上，過去建立的數位堡壘將不堪一擊。這正是 Anthropic 研究的起點。

Anthropic 的解法：訓練 AI 成為網路安全分析師

面對日益嚴峻的 AI 攻擊威脅，Anthropic 提出了一個直接的應對方案：與其被動防守，不如主動出擊，訓練 AI 成為防禦體系的核心。他們的研究重點，就是將旗下的 Claude 模型，打造成一個能夠主動發現、分析並修復安全漏洞的 AI 網路安全專家。

從「通用助理」到「專業打手」

Anthropic 指出，像 Claude 這樣的大型語言模型，其網路安全能力最初只是一種「湧現能力」（emergent abilities）。也就是說，隨著模型規模擴大，它自然而然學會了一些安全相關的技能，但這並非刻意訓練的結果。然而，意識到 AI 在網路安全領域的急迫性後，Anthropic 決定投入專門的資源，強化 Claude 在幾個關鍵防禦任務上的表現：

程式碼漏洞挖掘：訓練 AI 自動審查程式碼，找出潛在的安全弱點。
漏洞修補：不僅要找出問題，更要能提出具體的修復方案。
模擬環境測試：在模擬的系統環境中，測試 AI 發現與應對威脅的能力。

值得注意的是，Anthropic 強調他們刻意避免增強那些明顯有利於「攻擊方」的能力，例如進階的漏洞利用或惡意軟體撰寫。他們的目標是讓 AI 成為開發階段就能預防問題、部署後能即時修復問題的可靠夥伴。

用實戰評測證明能力

為了驗證訓練成果，Anthropic 讓最新版的 Claude Sonnet 4.5 參與了多項業界標準的網路安全評測，並取得了驚人的成績。

在一項名為 Cybench 的評測中（其挑戰題目來自真實的駭客搶旗競賽 Capture-the-Flag, CTF），Claude Sonnet 4.5 的表現不僅超越了前代模型，甚至比僅僅兩個月前發布的頂級模型 Opus 4.1 更強大。在其中一項挑戰中，Claude 只花了 38 分鐘，就完成了分析網路流量、解壓縮惡意軟體並解密的複雜任務，而這項任務預計需要一位人類專家至少一小時才能完成。當給予 10 次嘗試機會時，Claude Sonnet 4.5 在 Cybench 上的成功率高達 76.5%，這個數字在短短六個月內翻了一倍。

在另一項名為 CyberGym 的評測中，AI 需要在真實的開源軟體專案中找出已知的漏洞，甚至挖掘全新的未知漏洞。結果顯示，在給予 30 次嘗試機會後，Claude Sonnet 4.5 成功在 66.7% 的專案中重現已知漏洞，更在超過 33% 的專案中發現了前所未見的新漏洞。這證明了 AI 不僅能學習已知的攻擊模式，更有潛力發現人類尚未察覺的零日漏洞。

這些數據清晰地表明，透過專門的訓練，AI 在網路防禦任務上的能力正在快速提升，已經從理論上的可能性，轉變為實務上的即戰力。

TN科技筆記的洞察

個人認為最值得關注的是「防禦規模化」的可能性。長久以來，網路攻防一直處於不對等的狀態：攻擊方可以利用自動化工具，以極低的成本發動大規模、廣泛的攻擊；而防禦方則高度依賴有限的人力，逐一應對、修補。Anthropic 的研究顯示，AI 有潛力徹底改變這個局面。當 AI 防禦者能夠 24 小時不間斷地自動審查數百萬行程式碼、分析極大量的系統 log、甚至自動生成修補程式時，防禦方終於有機會在「規模」上與攻擊方抗衡。這不僅是效率的提升，更是防禦思維的根本轉變。
然而 Anthropic 雖然強調其研究專注於防禦，但我們無法忽視一個事實：一個能高效找出漏洞的 AI，本身就是一把雙面刃。攻擊者必然也會嘗試利用相同或更先進的 AI 技術來開發更隱蔽、更複雜的攻擊手法。這將導致攻防雙方的技術迭代速度越來越快，未來可能出現 AI 自動攻擊系統與 AI 自動防禦系統在網路上進行電影般毫秒級的對抗，屆時，人類的反應速度將遠遠跟不上。此外，「AI 的可信度」也是一大問題。我們能在多大程度上信任 AI 做出的判斷？如果 AI 誤判，將一個正常的系統行為標記為攻擊，並自動採取阻斷措施，可能會造成比駭客攻擊更嚴重的營運中斷。因此，如何建立有效的人機協作（Human-in-the-loop）機制，確保 AI 的決策受到監督與控制，將是這項技術能否成功落地的關鍵。

支持TN科技筆記，與科技共同前行

我是TN科技筆記，如果喜歡這篇文章，歡迎留言、點選愛心、轉發給我支持鼓勵～～～也歡迎每個月請我喝杯咖啡，鼓勵我撰寫更多科技文章，一起跟著科技浪潮前進！！>>>>> 請我喝一杯咖啡

在此也感謝每個月持續請我喝杯咖啡的讀者們，讓我更加有動力為各位帶來科技新知！

以下是我的 threads 也歡迎追蹤、回覆、轉發喔！

>>>>> TN科技筆記(TechNotes)

TN科技筆記(TechNotes)的沙龍科技領域筆記

留言

留言分享你的想法！

TN科技筆記(TechNotes)的沙龍

58會員

190內容數

大家好，我是TN，喜歡分享科技領域相關資訊，希望各位不吝支持與交流！

TN科技筆記(TechNotes)的沙龍的其他內容

2025/10/01

Sora 2 登場，被譽為「影片界的 GPT-3.5 時刻」：與 Veo 3、Kling、Runway 的對決

AI 影片生成領域的競爭，正以前所未有的速度升溫。過去，我們驚嘆於靜態圖片的生成，如今，高品質、具備物理真實感、甚至能同步生成聲音的動態影片，正走向我們的生活。2025 年 9 月 30 日，OpenAI 正式發表了其最新的影片生成模型 Sora 2，更被其內部譽為「影片界的 GPT-3.5 時刻」

2025/10/01

Sora 2 登場，被譽為「影片界的 GPT-3.5 時刻」：與 Veo 3、Kling、Runway 的對決

2025/09/30

Claude 4.5 Sonnet ：Anthropic 在 AI 編碼與 Agent 賽道的關鍵一步

在人工智慧模型推陳出新的浪潮中，我們很容易對各種版本的更新感到麻木。然而，Anthropic 公司於 2025 年 9 月 30 日發布的 Claude 4.5 Sonnet，值得我們停下腳步探究。

2025/09/30

Claude 4.5 Sonnet ：Anthropic 在 AI 編碼與 Agent 賽道的關鍵一步

2025/09/26

Google 推出 Gemini Robotics-ER 1.5：為通用機器人打造一顆會「思考」的大腦

長期以來，我們對於能夠處理家務、協助工作的智慧機器人，總有著無限的想像。然而，一個機器人要能夠在我們混亂的廚房中準確地分類垃圾，或是在變動的倉儲環境裡重新整理貨物，它需要的遠不只是一雙「眼睛」和一雙「手」，更需要一顆能夠理解複雜指令、規劃多步驟任務、並適應環境變化的「大腦」。

2025/09/26

Google 推出 Gemini Robotics-ER 1.5：為通用機器人打造一顆會「思考」的大腦

#AI 的其他內容

國一兒子段考前4天才說…我拿Gemini當小祕書，30分鐘整理完歷史重點，還多出好多親子時光

IEO 國際財經科技前沿觀察

記憶體外，下一個供不應求行業，能見度看到2028

學習玩家｜啟動玩心學習

NotebookLM 視覺敘事再升級：資訊圖表與簡報製作登場

你可能也想看

SISI人妻小日常的沙龍

【蝦皮雙12開箱清單】回購率100%！我的真實愛用＋今年想買的清單整理（含分潤推薦碼）

每年 12 月，我最期待的就是蝦皮的雙12狂歡生日慶！身為每個月都會在蝦皮買生活用品的創作者，真的有太多值得分享的愛用品。這篇整理了我： ✔ 實際買過、覺得必須分享的 6 項愛用開箱 ✔ 今年雙12準備補貨及購入的購物清單 ✔ 省錢攻略＋蝦皮分潤計畫，新手也能邊買邊賺！ 📌現在加入領$1

#蝦皮分潤計畫#蝦皮1212#蝦皮免運

2025/12/05

SISI人妻小日常的沙龍

【蝦皮雙12開箱清單】回購率100%！我的真實愛用＋今年想買的清單整理（含分潤推薦碼）

#蝦皮分潤計畫#蝦皮1212#蝦皮免運

2025/12/05

貪生pass

💥 雙12必搶！我的居家儀式感養成術：高 CP 值好物清單 × 蝦皮分潤賺錢術！

各位被生活壓得喘不過氣的勇者們，請停下你匆忙的腳步！你是不是常常覺得：錢包是個黑洞，時間是個幻覺，每天都在執行「重複昨天的厭世」這個艱難的任務？這不是你的錯，這是你的人生被施加了幾道咒語！今天，身為資深（但還沒躺平成功）的魔法道具蒐集家，我要公開這份能讓你的人生瞬間充滿「微幸福感」的魔法清單

#蝦皮#蝦皮分潤計畫#蝦皮1212

2025/12/05

貪生pass

💥 雙12必搶！我的居家儀式感養成術：高 CP 值好物清單 × 蝦皮分潤賺錢術！

#蝦皮#蝦皮分潤計畫#蝦皮1212

2025/12/05

烏托邦邦的沙龍

『人工智能』AI的崛起早已對人類產生威脅？！

人工智能:革命性技術的崛起與挑戰 1. 什麼是人工智能? 人工智能(AI)是指由人類創造的機器或系統,能夠模仿人類智能,執行通常需要人類智能才能完成的任務。這包括學習、問題解決、語言理解、視覺感知等能力。AI系統可以處理大量數據,識別模式,並根據這些信息做出決策或預測。 2.

#人工智能#ai#科技

2024/08/06

烏托邦邦的沙龍

『人工智能』AI的崛起早已對人類產生威脅？！

#人工智能#ai#科技

2024/08/06

熙哥生意之道

人工智能AI和機器學習ML：業務升級的新動能

在當今快速發展的技術時代，人工智能 Artificial Intelligence 和機器學習 Machine Learning 已成為推動業務創新和增長的重要力量。從改善客戶服務到優化運營流程，AI和ML的應用範圍日益廣泛，為企業創造出前所未有的機會。企業又可如何利用AI和ML提升業務呢？

#AI#ML#人工智能

2024/07/26

熙哥生意之道

人工智能AI和機器學習ML：業務升級的新動能

#AI#ML#人工智能

2024/07/26

⏳熵妮的沙龍☆

人工智能7個巨大危險逐漸顯露...

人工智慧系統正在慢慢影響我們的生活，並在不同的產業和產品中得到應用。目前使用的系統大多是基於狹義人工智慧。狹義人工智慧與通用人工智慧有很大不同。狹義人工智慧的創建是為了專注於特定任務，一個例子就是聊天機器人。

2024/06/06

2024/06/06

2024 網路攻擊和勒索軟體趨勢解析 2024 Cyberattack & Ransomware Trends

經歷疫情兩年，網路勒索的情況稍緩。然而，隨著網路威脅情勢的不斷發展，2023 年勒索軟體再次出現，著實令人擔憂。越來越多駭客針對資訊業與實體供應鏈發動大規模的網路攻擊，並找到新的方式，向大大小小的企業勒索金錢。因此，「網路風險」也成為各企業最關心的問題之一。單就勒索軟體活動，在 2023 年上半

#網路攻擊#勒索軟體#網路風險

2024/05/28

美國人力資源港 - 九思觀點

2024 網路攻擊和勒索軟體趨勢解析 2024 Cyberattack & Ransomware Trends

#網路攻擊#勒索軟體#網路風險

2024/05/28

知言法律事務所的沙龍

【兩岸法律信箱】AI新興科技與法律衝擊

從Open AI推出Chat GPT3.5以來，2023年幾乎話題都圍繞著生成AI，在經濟市場上，AI科技股看好看漲，而AI的運用，更是突破大家的想像。甚至連詐騙集團都趕上AI的風潮。之前節目有針對兩岸詐騙手法與模式作介紹，想進一步瞭解，在AI浪潮之下，兩岸就AI的法律有沒有什麼相應的管制或措施？

2024/05/09

2024/05/09

公司如何防範 AI 風險 How Companies Can Safeguard Against AI Risks

自從 2022 年 11 月 30 日 ChatGPT 推出後，引發了一場狂熱，世界也就改變了。生成式 AI 在企業中的應用迅速擴展，帶來新的效率與商機。由於企業內部安裝設罝必要安控護欄的速度，遠不及生成式 AI 的使用擴展速度，因此增加企業潛在的風險，並產生巨大的隱憂。

#人工智能#ChatGPT#AI風險

2024/05/01

美國人力資源港 - 九思觀點

公司如何防範 AI 風險 How Companies Can Safeguard Against AI Risks

#人工智能#ChatGPT#AI風險

2024/05/01

悅陽財經閱讀筆記

快速發展的人工智慧背後所醞釀的道德危機《AI×人類演化未來報告書》

2024年第一季這波台股與美股的強勢上漲，其實都能歸功於AI這個未來趨勢，不過在AI一片看好之下，也有非常多人對這個產業趨勢感到憂心。

#AI×人類演化未來報告書#AI#商業

2024/04/02

悅陽財經閱讀筆記

快速發展的人工智慧背後所醞釀的道德危機《AI×人類演化未來報告書》

2024年第一季這波台股與美股的強勢上漲，其實都能歸功於AI這個未來趨勢，不過在AI一片看好之下，也有非常多人對這個產業趨勢感到憂心。

#AI×人類演化未來報告書#AI#商業

2024/04/02

米奇幻世界

人工智能：未來的新篇章

數位化時代中，人工智能（AI）已成為推動創新和進步的關鍵力量。本文探討AI的現狀、挑戰以及未來可能性，並提出負責任地發展和使用AI的思考。

#挑戰#人工智能#責任

2024/03/12

米奇幻世界

人工智能：未來的新篇章

數位化時代中，人工智能（AI）已成為推動創新和進步的關鍵力量。本文探討AI的現狀、挑戰以及未來可能性，並提出負責任地發展和使用AI的思考。

#挑戰#人工智能#責任

2024/03/12

米奇幻世界

人工智慧（AI）的未來展望

人工智慧（AI）的未來展望在當今這個科技日新月異的時代，人工智慧（AI）已成為推動創新和進步的重要力量。從自動駕駛汽車到精準醫療，AI的應用範圍不斷擴大，其潛力無限。然而，隨著AI技術的快速發展，我們也必須關注其對社會、經濟和倫理的影響。

2024/03/11

2024/03/11

存股筆記 (2024-02-27) - AI 應用與經濟衰退

AI 對於這個世界絕對是全新的幫助，也有明確的商業模式你再也不需要請人寫文案，照片和影像可以即時產出對於語言和世界的理銞也會變得快速這一切都在快速地改變世界當中但其危險的是，隱隱約約有著要泡沬化的步調

2024/02/27

存股筆記 (2024-02-27) - AI 應用與經濟衰退

2024/02/27

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News