Activer la protection contre le caractère offensant pour l’IA générative
Activez la protection contre le caractère offensant pour enregistrer et ajoutez l’option permettant de bloquer le contenu offensant dans le texte et les conversations générés par l’IA.
Avant de commencer
Rôle requis : sn_generative_ai.nsa_admin
Pourquoi et quand exécuter cette tâche
L’IA générative est probabiliste, ce qui signifie que les sorties sont basées sur des probabilités, et que l’utilisation de la même entrée deux fois ne garantit pas la même sortie. Une partie du matériel généré par l’IA pourrait potentiellement être indésirable en raison de sa toxicité, de son sexisme ou d’autres sentiments offensants. Gardien Now Assist vous permet d’enregistrer tout contenu détecté comme offensant. Si vous le souhaitez, vous pouvez également bloquer le contenu offensant afin que les utilisateurs ne voient pas le contenu généré. Au lieu de cela, ils voient un message indiquant que le matériel offensant a été détecté et bloqué.
Consultez Gardien Now Assist pour plus d’informations.
Les journaux peuvent être exportés pour examen. Pour obtenir des instructions sur la manière de procéder, consultez Exporter les journaux du Gardien Now Assist.
Procédure
Résultats
Le garde-fou de Caractère offensant du Gardien Now Assist est activé sur votre instance pour le workflow que vous avez sélectionné.
Que faire ensuite
Vous pouvez activer la protection contre le caractère offensant pour toutes les applications Now Assist que vous avez activées sur votre instance. Si vous souhaitez modifier l’impact de votre détection, vous pouvez sélectionner d’autres options ( ) dans la liste des workflows actifs et choisir Modifier.
Vous pouvez désactiver la protection contre le caractère offensant pour votre workflow à tout moment en sélectionnant d’autres options et en choisissant Désactiver.