Activer la protection contre le caractère offensant pour l’IA générative

Yokohama : activer l’IA

Release

yokohama

ft:locale

fr-FR

ft:publication_title

Yokohama : activer l’IA

ft:clusterId

platai

bundleId

platai

workflow

Platform

Activer la protection contre le caractère offensant pour l’IA générative

Rversion finale: Yokohama

Mis à jour 30 janv. 2025

1 minute de lecture

Activez la protection contre le caractère offensant pour enregistrer et ajoutez l’option permettant de bloquer le contenu offensant dans le texte et les conversations générés par l’IA.

Avant de commencer

Rôle requis : sn_generative_ai.nsa_admin

Pourquoi et quand exécuter cette tâche

L’IA générative est probabiliste, ce qui signifie que les sorties sont basées sur des probabilités, et que l’utilisation de la même entrée deux fois ne garantit pas la même sortie. Une partie du matériel généré par l’IA pourrait potentiellement être indésirable en raison de sa toxicité, de son sexisme ou d’autres sentiments offensants. Gardien Now Assist vous permet d’enregistrer tout contenu détecté comme offensant. Si vous le souhaitez, vous pouvez également bloquer le contenu offensant afin que les utilisateurs ne voient pas le contenu généré. Au lieu de cela, ils voient un message indiquant que le matériel offensant a été détecté et bloqué.

Consultez Gardien Now Assist pour plus d’informations.

Les journaux peuvent être exportés pour examen. Pour obtenir des instructions sur la manière de procéder, consultez Exporter les journaux du Gardien Now Assist.

Procédure

Accédez à la Tout > Administrateur Now Assist > Paramètres.
Dans le panneau latéral, sélectionnez l’icône Gardien Now Assist > Caractère offensant onglet.
Accédez à l’onglet Disponible pour vous pour voir les workflows que vous pouvez choisir.
Si des garde-fous contre Caractère offensant sont déjà activés, ils apparaissent dans l’onglet Actif .
Sélectionnez Activer pour le workflow sur lequel vous souhaitez activer la protection contre le caractère offensant.
Sélectionnez votre détection d’impact.
Le Gardien Now Assist consigne quand du contenu offensant est détecté ou généré lorsque la protection contre le caractère offensant est activée. Vous pouvez également choisir de bloquer ou non le contenu de l’utilisateur. Si vous choisissez de bloquer le contenu, l’utilisateur voit un message standardisé expliquant que le contenu offensant a été bloqué au lieu de ce qui a été généré.
Sélectionnez Enregistrer.

Résultats

Le garde-fou de Caractère offensant du Gardien Now Assist est activé sur votre instance pour le workflow que vous avez sélectionné.

Que faire ensuite

Vous pouvez activer la protection contre le caractère offensant pour toutes les applications Now Assist que vous avez activées sur votre instance. Si vous souhaitez modifier l’impact de votre détection, vous pouvez sélectionner d’autres options ( ) dans la liste des workflows actifs et choisir Modifier.

Vous pouvez désactiver la protection contre le caractère offensant pour votre workflow à tout moment en sélectionnant d’autres options et en choisissant Désactiver.