Prompt Hijacking(或稱為 Prompt Hacking)

更新於 發佈於 閱讀時間約 2 分鐘

Prompt Hijacking(或稱為 Prompt Hacking)是一種針對大型語言模型(LLMs)的攻擊手法,透過精心設計的輸入或提示操控(prompt manipulation),使模型執行開發者未預期或不想要的動作。這與傳統軟體漏洞攻擊不同,因為它利用的是模型對輸入提示的敏感性和解讀機制。

具體來說,Prompt Hijacking 透過在輸入提示中插入或隱藏惡意指令,使模型忽略原本的系統指令或安全規範,生成不當內容、洩露內部信息,或進行錯誤操作。它包含幾種常見類型:

Prompt Injection(提示注入):直接在用戶輸入中加入惡意指令,覆寫或干擾模型原先的行為設定,像是在正常對話中“偷偷”下命令。

Prompt Leaking(提示洩漏):通過誘導模型洩露其內置的隱藏提示、系統指令或敏感資料。

Jailbreaking(越獄):繞過模型的內容限制或安全過濾,讓模型生成平時禁止的有害或不當內容。

這些攻擊可能帶來重大的安全風險,包括洩露敏感資訊、生成欺騙性或錯誤內容,損害用戶信任及倫理問題。

防範措施包括限制提示注入、監控異常行為、設計堅固的提示結構以及模型微調來加強安全性。

總結:

Prompt Hijacking 是透過巧妙操控語言模型輸入提示來誘使模型繞過安全限制並執行未預期工作的一種攻擊技術,包括提示注入、提示洩漏和越獄三大類型,對模型安全和可信度造成威脅。

留言
avatar-img
留言分享你的想法!
avatar-img
郝信華 iPAS AI應用規劃師 學習筆記
13會員
275內容數
現職 : 富邦建設資訊副理 證照:經濟部 iPAS AI應用規劃師
2025/07/25
Kibana 是一款開源的資料視覺化和探索工具,專門用來與 Elasticsearch(及 Amazon OpenSearch Service)搭配使用。它提供用戶建立互動式儀表板,能夠視覺化搜尋結果和分析資料,方便即時數據探索與監控。 在 AWS 上,Kibana 主要作為 Amazon Ope
2025/07/25
Kibana 是一款開源的資料視覺化和探索工具,專門用來與 Elasticsearch(及 Amazon OpenSearch Service)搭配使用。它提供用戶建立互動式儀表板,能夠視覺化搜尋結果和分析資料,方便即時數據探索與監控。 在 AWS 上,Kibana 主要作為 Amazon Ope
2025/07/25
Elasticsearch 是一個基於 Apache Lucene 的分散式搜尋與分析引擎,廣泛用於全文檢索、日誌分析、安全資訊分析、商業分析和即時操作智慧等場景。它以 JSON 文件為資料格式,支援快速的資料索引與查詢,能在多節點叢集中水平擴展,並具有高可用性與近乎即時的搜索能力。 在 AWS
2025/07/25
Elasticsearch 是一個基於 Apache Lucene 的分散式搜尋與分析引擎,廣泛用於全文檢索、日誌分析、安全資訊分析、商業分析和即時操作智慧等場景。它以 JSON 文件為資料格式,支援快速的資料索引與查詢,能在多節點叢集中水平擴展,並具有高可用性與近乎即時的搜索能力。 在 AWS
2025/07/25
Amazon Bedrock Playground 是 AWS Management Console 中一個視覺化的工具介面,讓使用者能在整合的環境中 試驗和互動不同的 Amazon Bedrock 基礎模型(Foundation Models),以便測試模型效果、比較多個模型輸出,並調整提示詞和參
2025/07/25
Amazon Bedrock Playground 是 AWS Management Console 中一個視覺化的工具介面,讓使用者能在整合的環境中 試驗和互動不同的 Amazon Bedrock 基礎模型(Foundation Models),以便測試模型效果、比較多個模型輸出,並調整提示詞和參
看更多
你可能也想看
Thumbnail
這篇內容,將會講解什麼是函式,以及與函式相關的知識。包括函式的簡介、Runtime Function、自訂函式、Script Function 腳本函式、Method 方法。
Thumbnail
這篇內容,將會講解什麼是函式,以及與函式相關的知識。包括函式的簡介、Runtime Function、自訂函式、Script Function 腳本函式、Method 方法。
Thumbnail
#maxask #惡意軟體 #瀏覽器被惡意或廣告工具綁架 URL轉址(重定向、重新導向):當使用者瀏覽A網址時,自動跳轉到B網址。 - 發生情境: 使用edge瀏覽器,使用Google搜尋引擎, 搜尋XXX關鍵字,網頁自動跳轉到maxask的搜尋介面。
Thumbnail
#maxask #惡意軟體 #瀏覽器被惡意或廣告工具綁架 URL轉址(重定向、重新導向):當使用者瀏覽A網址時,自動跳轉到B網址。 - 發生情境: 使用edge瀏覽器,使用Google搜尋引擎, 搜尋XXX關鍵字,網頁自動跳轉到maxask的搜尋介面。
Thumbnail
資訊作戰是一個廣泛的術語,包含一系列旨在影響對手或目標受眾行為、感知或決策的活動。可用於實現各種目標,包括: 獲取或維持信息優勢,干擾或否認對手的溝通能力,損害對手的聲譽或可信度,在對手內部種下紛爭或分裂,影響敵人人口的行為。 資訊操作可使用各種方法進行: 網絡戰, 心理戰, 社會工程, 資訊不實
Thumbnail
資訊作戰是一個廣泛的術語,包含一系列旨在影響對手或目標受眾行為、感知或決策的活動。可用於實現各種目標,包括: 獲取或維持信息優勢,干擾或否認對手的溝通能力,損害對手的聲譽或可信度,在對手內部種下紛爭或分裂,影響敵人人口的行為。 資訊操作可使用各種方法進行: 網絡戰, 心理戰, 社會工程, 資訊不實
Thumbnail
本文介紹如何對 Telegram 憑證監控機器人的代碼進行優化,包括新增指令、讀取變數、提高可讀性和可維護性。
Thumbnail
本文介紹如何對 Telegram 憑證監控機器人的代碼進行優化,包括新增指令、讀取變數、提高可讀性和可維護性。
Thumbnail
Function的使用方式
Thumbnail
Function的使用方式
Thumbnail
在社群平臺上,一切的可見度都受到演算法控制,想要增加曝光就必須深入瞭解演算法的運作方式。本篇文章將透過說明演算法的運作方式以及狙擊演算法的第一步:HOOK來提供一些策略,協助創作者應對平臺演算法的變化。
Thumbnail
在社群平臺上,一切的可見度都受到演算法控制,想要增加曝光就必須深入瞭解演算法的運作方式。本篇文章將透過說明演算法的運作方式以及狙擊演算法的第一步:HOOK來提供一些策略,協助創作者應對平臺演算法的變化。
Thumbnail
本文介紹如何使用 TG Bot 來操作 MongoDB,包括讀取所有 domain、讀取特定 domain、新增 domain、批量新增 domain、修改 domain 和刪除 domain。透過 TG Bot 的指令操作,實現了自動化管理和多環境管理。
Thumbnail
本文介紹如何使用 TG Bot 來操作 MongoDB,包括讀取所有 domain、讀取特定 domain、新增 domain、批量新增 domain、修改 domain 和刪除 domain。透過 TG Bot 的指令操作,實現了自動化管理和多環境管理。
Thumbnail
代理模式通過封裝原始對象來實現對該對象的控制和管理,同時不改變原始對象的行為或客戶端與該對象互動的方式,以此介入或增強對該對象的訪問和操作。
Thumbnail
代理模式通過封裝原始對象來實現對該對象的控制和管理,同時不改變原始對象的行為或客戶端與該對象互動的方式,以此介入或增強對該對象的訪問和操作。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News