AWS Bedrock Guardrails 是 Amazon Bedrock 提供的一項功能,旨在幫助企業建立負責任且安全的生成式 AI 應用程式。它允許你根據自身的需求和負責任的 AI 政策制定內容限制,確保終端使用者的輸入和模型產生的輸出都符合規範。
以下是關於 AWS Bedrock 護欄的一些重點:
* 內容過濾: 護欄可以自動評估使用者輸入和基礎模型的回應,並根據你設定的閾值篩選掉有害的多模態內容,包括仇恨言論、侮辱性字眼、性、暴力以及涉及犯罪活動等不當行為的主題。* 提示攻擊防護: 護欄有助於防範提示注入和越獄等提示攻擊。
* 幻覺防範 (有限度): 某些護欄功能可以利用自動推理來協助防止由模型產生的不實資訊 (幻覺)。
* 可配置性: 你可以使用簡短的自然語言描述來定義應用程式上下文中需要避免的主題。護欄能夠偵測並封鎖使用者輸入和模型回應中受限主題的使用。例如,在銀行助理中,你可以限制與投資建議相關的話題。
* 敏感資訊篩選: 你可以設定篩選條件來封鎖或遮罩敏感資訊,例如個人身分識別資訊 (PII)。
* 自訂篩選: 你可以設定篩選條件來封鎖不需要的特定字詞、片語或不雅用語。
* 跨多種基礎模型: Bedrock 的護欄功能適用於多種基礎模型,包括 Anthropic Claude、Meta Llama 2、Cohere Command、AI21 Labs Jurassic 和 Amazon Titan Text,以及經過微調的模型。
* 易於使用: 你可以使用自然語言定義禁用的主題,並調整內容過濾器的閾值。
* 測試和版本控制: 你可以測試護欄的配置是否符合你的使用案例需求,並建立護欄的版本進行迭代管理。
簡單來說,AWS Bedrock 護欄就像是你為生成式 AI 應用程式設置的安全防護網,幫助你控制輸入和輸出的內容,以確保應用程式的安全性、合規性和可靠性。