生成 AI の不快感保護を有効にする
不快感検出をアクティブ化して、 Now Assist スキルとワークフローによって生成された不快なコンテンツをログに記録またはブロックします。
始める前に
必要なロール:sn_generative_ai.nsa_admin
このタスクについて
生成 AI の出力は確率的であり、同じ入力でも異なる出力が生成される可能性があります。AI で生成されたコンテンツの一部は、有害な言葉、性差別的な言葉、その他の有害な言葉など、不快なものである可能性があります。 Now Assist ガーディアン は、入力と出力の両方で不快なコンテンツを検出し、検出された場合はイベントをログに記録します。また、不快な内容をブロックして、生成された応答の代わりに標準のエラーメッセージをユーザーに表示するように構成することもできます。
注:
攻撃性検出は、特定の Now Assist スキルとワークフローにのみ適用されます。すべての Now Assist アプリケーションで使用できるわけではありません。攻撃性検出をサポートするスキルのリストの詳細については、「 Now Assist Guardian」を参照してください。
レビュー用にログをエクスポートできます。詳細については、「 Now Assist Guardian ログのエクスポート」を参照してください。
手順
タスクの結果
選択したワークフローのインスタンスで不快感検出ガードレールが有効になっています。不快なコンテンツが検出または生成されると、イベントがログに記録されます。
次のタスク
サポートされている Now Assist アプリケーションとワークフローごとに個別に不快感検出を有効にすることができます。攻撃性保護を有効にするワークフローごとにこのタスクを繰り返します。
アクティブなワークフローの検出の影響を変更するには、その他のオプション ( を選択します アイコン アクティブなワークフローのリストで、[ 編集] を選択します。
ワークフローの攻撃性保護を非アクティブ化するには、アクティブなワークフローのリストでその他のオプション ( ) アイコンを選択し、[ 非アクティブ化] を選択します。