Prompt Hijacking（或稱為 Prompt Hacking）

2025/08/08 更新2025/07/25 發佈閱讀 2 分鐘

Prompt Hijacking（或稱為 Prompt Hacking）是一種針對大型語言模型（LLMs）的攻擊手法，透過精心設計的輸入或提示操控（prompt manipulation），使模型執行開發者未預期或不想要的動作。這與傳統軟體漏洞攻擊不同，因為它利用的是模型對輸入提示的敏感性和解讀機制。

具體來說，Prompt Hijacking 透過在輸入提示中插入或隱藏惡意指令，使模型忽略原本的系統指令或安全規範，生成不當內容、洩露內部信息，或進行錯誤操作。它包含幾種常見類型：

• Prompt Injection（提示注入）：直接在用戶輸入中加入惡意指令，覆寫或干擾模型原先的行為設定，像是在正常對話中“偷偷”下命令。

• Prompt Leaking（提示洩漏）：通過誘導模型洩露其內置的隱藏提示、系統指令或敏感資料。

• Jailbreaking（越獄）：繞過模型的內容限制或安全過濾，讓模型生成平時禁止的有害或不當內容。

這些攻擊可能帶來重大的安全風險，包括洩露敏感資訊、生成欺騙性或錯誤內容，損害用戶信任及倫理問題。

防範措施包括限制提示注入、監控異常行為、設計堅固的提示結構以及模型微調來加強安全性。

總結：

Prompt Hijacking 是透過巧妙操控語言模型輸入提示來誘使模型繞過安全限制並執行未預期工作的一種攻擊技術，包括提示注入、提示洩漏和越獄三大類型，對模型安全和可信度造成威脅。

含 AI 應用內容

郝信華 iPAS AI應用規劃師學習筆記AWS AIF-C01

留言

留言分享你的想法！

郝信華 iPAS AI應用規劃師學習筆記

25會員

495內容數

現職 : 富邦建設資訊副理證照：經濟部 iPAS AI應用規劃師 AWS Certified AI Practitioner (AIF-C01)

郝信華 iPAS AI應用規劃師學習筆記的其他內容

2025/07/25

Kibana

Kibana 是一款開源的資料視覺化和探索工具，專門用來與 Elasticsearch（及 Amazon OpenSearch Service）搭配使用。它提供用戶建立互動式儀表板，能夠視覺化搜尋結果和分析資料，方便即時數據探索與監控。在 AWS 上，Kibana 主要作為 Amazon Ope

2025/07/25

Kibana

2025/07/25

Elasticsearch

Elasticsearch 是一個基於 Apache Lucene 的分散式搜尋與分析引擎，廣泛用於全文檢索、日誌分析、安全資訊分析、商業分析和即時操作智慧等場景。它以 JSON 文件為資料格式，支援快速的資料索引與查詢，能在多節點叢集中水平擴展，並具有高可用性與近乎即時的搜索能力。在 AWS

2025/07/25

Elasticsearch

2025/07/25

Amazon Bedrock Playground

Amazon Bedrock Playground 是 AWS Management Console 中一個視覺化的工具介面，讓使用者能在整合的環境中試驗和互動不同的 Amazon Bedrock 基礎模型（Foundation Models），以便測試模型效果、比較多個模型輸出，並調整提示詞和參

2025/07/25

Amazon Bedrock Playground

看更多

你可能也想看

夢夢 🍰 甜點魔法

全家限定！療癒系馬來貘雪糕，創意吃法大公開｜豆漿燕麥碗、藍莓果昔

還在煩惱平凡日常該如何增添一點小驚喜嗎？全家便利商店這次聯手超萌的馬來貘，推出黑白配色的馬來貘雪糕，不僅外觀吸睛，層次豐富的雙層口味更是讓人一口接一口！本文將帶你探索馬來貘雪糕的多種創意吃法，從簡單的豆漿燕麥碗、藍莓果昔，到大人系的奇亞籽布丁下午茶，讓可愛的馬來貘陪你度過每一餐，增添生活中的小確幸！

#懶人料理#食譜#健康甜點

2025/10/15