Protection contre les menaces de l’IA
Découvrez comment Now Assist vous aide à vous défendre contre les menaces spécifiques à l’IA, notamment le contenu offensant, l’injection d’invite et la détection de sujets sensibles grâce à Gardien Now Assist.
Gardien Now Assist Surveille les demandes envoyées aux grands modèles de langage et leurs réponses pour vous protéger, vous, vos utilisateurs et vos données. Il détecte les contenus offensants ou nuisibles, les tentatives d’injection d’invite et les sujets sensibles, et peut enregistrer ou bloquer le contenu détecté en fonction de votre configuration.
Configurer les garde-fous
Les rubriques suivantes décrivent comment installer Gardien Now Assist et configurer les garde-fous disponibles pour Now Assist les compétences et les agents IA.
- Découvrez comment surveille le Gardien Now Assist contenu de l’IA générative lors de l’exécution, quelles catégories de contenu elle détecte et comment fonctionnent la journalisation et le blocage.
- Gérez le fournisseur de service Guardrail utilisé par Gardien Now Assist.
- Activez la protection contre le caractère offensant pour enregistrer et éventuellement bloquer le contenu offensant dans le texte et les conversations générés par l’IA.
- Activez ou désactivez la protection contre les attaques par injection d’invite pour le texte et les conversations générés par l’IA.
- Configurez des filtres pour rediriger les utilisateurs vers une autre rubrique lorsque certains éléments sont détectés dans une conversation d’Agent virtuel.
- Enable Now Assist Guardian for AI agents
- Activez Gardien Now Assist les agents IA pour identifier et bloquer automatiquement les messages offensants, contribuant ainsi à protéger vos workflows agentiques contre les contenus malveillants.
Surveiller l’activité du garde-fou
Les rubriques suivantes décrivent comment examiner et exporter Gardien Now Assist des journaux pour évaluer l’efficacité du garde-fou et prendre en charge l’examen de la sécurité.
- Now Assist Guardian analytics
- Surveillez les performances des garde-fous activés via Gardien Now Assist, notamment le suivi de la fréquence à laquelle le contenu offensant et les tentatives d’injection d’invite sont détectés.
- Exportez les journaux pour obtenir un Gardien Now Assist aperçu de la fréquence à laquelle les différents garde-fous sont détectés et utilisés.