AI 脅威対策
Now Assist が、Now Assist ガーディアン を使用した不快なコンテンツ、プロンプトインジェクション、機密性の高い主題の検出など、AI 固有の脅威からの防御にどのように役立つかについて説明します。
Now Assist ガーディアン は、大規模言語モデルに送信された要求とその応答を監視して、ユーザー、ユーザー、およびデータを保護します。攻撃的または有害なコンテンツ、プロンプトインジェクションの試行、機密性の高い件名を検出し、構成に応じて検出されたコンテンツをログに記録またはブロックできます。
ガードレールを構成
次のトピックでは、Now Assistスキルと AI エージェントで利用可能なガードレールをセットアップNow Assist ガーディアンおよび構成する方法について説明します。
- Now Assist ガーディアン が実行時に生成 AI コンテンツを監視する方法、検出するコンテンツのカテゴリ、ログ記録とブロックの仕組みについて説明します。
- Now Assist ガーディアン で使用されるガードレールサービスプロバイダーを管理します。
- 攻撃性保護をオンにして、AI が生成したテキストや会話の不快なコンテンツをログに記録し、オプションでブロックします。
- AI が生成したテキストと会話のプロンプトインジェクション攻撃保護をアクティブ化または非アクティブ化します。
- 仮想エージェントの会話で特定の主題が検出されたときにユーザーを別のトピックにリダイレクトするようにフィルターを設定します。
- Enable Now Assist Guardian for AI agents
- AI エージェントの Now Assist ガーディアン を有効にして不快なメッセージを自動的に識別してブロックし、有害なコンテンツからエージェント型ワークフローを保護します。
ガードレールアクティビティの監視
次のトピックでは、 Now Assist ガーディアン ログを確認およびエクスポートして、ガードレールの有効性を評価し、セキュリティレビューをサポートする方法について説明します。
- Now Assist Guardian analytics
- 不快なコンテンツやプロンプトインジェクションの試行が検出される頻度の追跡など、 Now Assist ガーディアンによって有効になっているガードレールのパフォーマンスを監視します。
- Now Assist ガーディアン からログをエクスポートして、さまざまなガードレールが検出および使用されている頻度に関するインサイトを取得します。