
Image by louisehoffmann83 from Pixabay
NVIDIA和Lakera AI發佈AI Agent風險等級框架:
- 低度風險 - - 工具誤用 工具濫用 輸出不正確
- 中度風險 - - 記憶汙染 記憶洩漏 個人資訊曝露
- 高度風險 - - 權限盜用 AI遭騙 AI串謀
明白授權
了解AI有什麼權限可做什麼事
人為確認
重要關鍵的工作任務由人確認
定期備份
還要儲存在AI無法存取的地方
定期檢視
請不要盲目信任AI的所作所為
慎用選項
審慎不要放任AI完全自動模式
安全隔離
使AI在獨立的沙箱環境中執行
安全架構
- 第一層 身份認證和存取控制
- 最小權限原則,AI只需有完成任務或達成目標所需的權限。
- 動態權限調整,根據情況適時調整。
- 第二層 資料加密和資料隔離
- 傳輸加密
- 靜態加密
- 資料脫敏
例如顯示身分證字號時,只顯示後三碼 *******678,或隱藏後七碼 P12*******,或部分遮罩 P1******78。
- 用戶隔離
使用同樣的AI Agent模型系統,不同用戶的資料必須嚴格地隔離。
- 第三層 動作監控和記錄追蹤
AI Agent完整操作記錄(追溯、稽核):
- 時間戳
- 操作類型
- 操作結果
- 存取範圍
- 觸發的使用者
- 第四層 輸入驗證和輸出過濾
- 第五層 異常偵測和人類督導
- 分級授權
- 緊急中止
- 偏離校準


















