生成 AI の攻撃性保護をアクティブ化する

Yokohama AI を有効にする

Release

yokohama

ft:locale

ja-JP

ft:publication_title

Yokohama AI を有効にする

ft:clusterId

platai

bundleId

platai

workflow

Platform

生成 AI の攻撃性保護をアクティブ化する

リリースバージョン: Yokohama

更新日 2025年01月30日

所要時間：2分

不快感に対する保護をオンにしてログ記録し、AI が生成したテキストや会話で不快なコンテンツをブロックするオプションを追加します。

始める前に

必要なロール:sn_generative_ai.nsa_admin

このタスクについて

生成 AI は確率的であり、出力は確率に基づいており、同じ入力を 2 回使用しても同じ出力が保証されません。AI によって生成された素材の一部は、有害性、性差別、またはその他の不快な感情のために望ましくない可能性があります。Now Assist Guardian を使用すると、不快感を与えると検出された素材をログに記録できます。必要に応じて、不快なコンテンツをブロックして、生成されたコンテンツがユーザーに表示されないようにすることもできます。代わりに、不快な素材が検出され、ブロックされたことを示すメッセージが表示されます。

詳細については、「 Now Assist Guardian 」を参照してください。

ログはレビュー用にエクスポートできます。その方法については、「 Now Assist Guardian ログのエクスポート」を参照してください。

手順

次のように移動する。 All (すべて) > Now Assist アドミン > 設定.
サイドパネルで、 Now Assist Guardian > 攻撃性学習します。
[ 利用可能] タブに移動して、選択できるワークフローを確認します。
既にアクティブになっている不快感ガードレールがある場合は、[ アクティブ ] タブに表示されます。
攻撃性保護を有効にするワークフローの [アクティブ化 ] を選択します。
影響検出を選択します。
Now Assist Guardian は、不快なコンテンツが検出されたときにログに記録するか、攻撃性保護がアクティブになったときに生成されます。ユーザーからのコンテンツをブロックするかどうかを選択することもできます。コンテンツのブロックを選択すると、不快なコンテンツが生成されたものではなくブロックされたことを説明する標準化されたメッセージがユーザーに表示されます。
[Save (保存)] をクリックする。

タスクの結果

Now Assist Guardian の不快ガードレールが、選択したワークフローのインスタンスで有効になります。

次のタスク

インスタンスで有効にしたすべての Now Assist アプリケーションに対して不快感保護を有効にすることができます。検出の影響を変更する場合は、アクティブなワークフローのリストでその他のオプション ( を選択し、[ 編集] を選択します。

ワークフローの不快感に対する保護は、その他のオプションを選択して [非アクティブ化] を選択することで、いつでも無効にできます。