Activer la protection contre le caractère offensant pour l’IA générative

  • Rversion finale: Yokohama
  • Mis à jour 30 janv. 2025
  • 1 minute de lecture
  • Activez la protection contre le caractère offensant pour enregistrer et ajoutez l’option permettant de bloquer le contenu offensant dans le texte et les conversations générés par l’IA.

    Avant de commencer

    Rôle requis : sn_generative_ai.nsa_admin

    Pourquoi et quand exécuter cette tâche

    L’IA générative est probabiliste, ce qui signifie que les sorties sont basées sur des probabilités, et que l’utilisation de la même entrée deux fois ne garantit pas la même sortie. Une partie du matériel généré par l’IA pourrait potentiellement être indésirable en raison de sa toxicité, de son sexisme ou d’autres sentiments offensants. Gardien Now Assist vous permet d’enregistrer tout contenu détecté comme offensant. Si vous le souhaitez, vous pouvez également bloquer le contenu offensant afin que les utilisateurs ne voient pas le contenu généré. Au lieu de cela, ils voient un message indiquant que le matériel offensant a été détecté et bloqué.

    Consultez Gardien Now Assist pour plus d’informations.

    Les journaux peuvent être exportés pour examen. Pour obtenir des instructions sur la manière de procéder, consultez Exporter les journaux du Gardien Now Assist.

    Procédure

    1. Accédez à la Tout > Administrateur Now Assist > Paramètres.
    2. Dans le panneau latéral, sélectionnez l’icône Gardien Now Assist > Caractère offensant onglet.
    3. Accédez à l’onglet Disponible pour vous pour voir les workflows que vous pouvez choisir.

      Si des garde-fous contre Caractère offensant sont déjà activés, ils apparaissent dans l’onglet Actif .

    4. Sélectionnez Activer pour le workflow sur lequel vous souhaitez activer la protection contre le caractère offensant.
    5. Sélectionnez votre détection d’impact.

      Le Gardien Now Assist consigne quand du contenu offensant est détecté ou généré lorsque la protection contre le caractère offensant est activée. Vous pouvez également choisir de bloquer ou non le contenu de l’utilisateur. Si vous choisissez de bloquer le contenu, l’utilisateur voit un message standardisé expliquant que le contenu offensant a été bloqué au lieu de ce qui a été généré.

      Garde-fou de Caractère offensant pour le Gardien Now Assist avec l’option « Journal uniquement » sélectionnée

    6. Sélectionnez Enregistrer.

    Résultats

    Le garde-fou de Caractère offensant du Gardien Now Assist est activé sur votre instance pour le workflow que vous avez sélectionné.

    Que faire ensuite

    Vous pouvez activer la protection contre le caractère offensant pour toutes les applications Now Assist que vous avez activées sur votre instance. Si vous souhaitez modifier l’impact de votre détection, vous pouvez sélectionner d’autres options ( icône Plus d’options.) dans la liste des workflows actifs et choisir Modifier.

    Vous pouvez désactiver la protection contre le caractère offensant pour votre workflow à tout moment en sélectionnant d’autres options et en choisissant Désactiver.