Configurer la protection contre les attaques par injection d’invite

  • Rversion finale: Yokohama
  • Mis à jour 30 janv. 2025
  • 1 minute de lecture
  • Activez ou désactivez la protection contre les attaques par injection d’invite pour le texte et les conversations générés par l’IA.

    Avant de commencer

    Rôle requis : sn_generative_ai.nsa_admin

    Pourquoi et quand exécuter cette tâche

    Les attaques par injection d’invite sont un type d’attaque de cybersécurité où quelqu’un tente de passer outre les instructions initiales d’un LLM pour provoquer des comportements involontaires. Gardien Now Assist peut détecter et enregistrer ces tentatives d’attaque, et vous pouvez choisir de bloquer ou non la réponse générée par l’IA après la tentative d’attaque.

    Consultez Gardien Now Assist pour plus d’informations.

    Les journaux peuvent être exportés pour examen. Pour obtenir des instructions sur la manière de procéder, consultez Exporter les journaux du Gardien Now Assist.

    Procédure

    1. Accédez à la Tout > Administrateur Now Assist > Paramètres.
    2. Dans le panneau latéral, accédez à Gardien Now Assist > Injection d'invite.
    3. Sélectionnez cette option pour modifier l’état actif de la protection contre les attaques par injection d’invite.

      La protection contre les attaques par injection d’invite est activée par défaut, ce qui signifie que le Gardien Now Assist enregistre les tentatives sauf si vous la désactivez.

    4. Facultatif : Sous Impact de détection, sélectionnez l’icône Options (icône Options),puis choisissez Modifier pour modifier l’impact de détection.

      Vous pouvez choisir si les attaques par injection d’invite sont bloquées ou enregistrées.

      Carte de sélection de l’impact de la détection de la protection contre l’injection d’invite avec « Journal uniquement » sélectionné

    Résultats

    Vous avez configuré si la protection contre les attaques par injection d’invite est activée sur votre instance et déterminé ce que vous souhaitez que le Gardien Now Assist fasse en cas de tentative.