Onglet Intégrité dans Tour de contrôle IA
Surveillez les performances des garde-fous activés via Gardien Now Assist.
L’onglet Intégrité du Tour de contrôle IA tableau de bord vous aide à surveiller et à évaluer l’efficacité du contenu offensant et des garde-fous d’injection d’invite actifs sur vos ServiceNow actifs IA.
Les visualisations de l’onglet Intégrité fournissent les informations suivantes.
- Latence moyenne résultant du contenu offensant actif et des garde-fous d’injection d’invite. Une latence élevée pourrait signifier une augmentation de l’activité des garde-fous au cours de la période.
- Nombre et pourcentage d’occurrences de contenu offensant et d’injection d’invite.
- Compétences pour lesquelles des occurrences de contenu offensant et d’injection d’invite ont été détectées.
Le tableau de bord ne prend pas en compte les données historiques pour les mesures d’intégrité.
Appliquez les filtres sur le tableau de bord pour afficher l’activité du garde-fou pour les compétences dans une plage de dates.
Efficacité du garde-fou du contenu
- Nombre d’éléments de contenu marqués
- Cette zone du tableau de bord affiche le nombre d’occurrences de contenu offensant et d’injection d’invite dans la plage de dates sélectionnée.
Figure 2. Nombre d’éléments de contenu marqués - Pourcentage d’éléments de contenu marqués comme étant utilisés au total
- Cette zone du tableau de bord affiche le pourcentage de demandes et de réponses à destination et en provenance du service de modèle de langage étendu (LLM) qui sont marquées comme étant offensantes et d’injection d’invite.
Figure 3. Pourcentage d’éléments de contenu marqués comme étant utilisés au total
Visualisations de contenu offensant
- Latence ajoutée par GuardRail
- Cette zone du tableau de bord affiche la latence moyenne résultant du garde-fou de contenu offensant actif pour les compétences et la plage de dates sélectionnées.
Figure 4. Latence ajoutée au garde-fou pour le caractère offensant - Pourcentage marqué comme offensant
- Cette zone du tableau de bord affiche le pourcentage de demandes et de réponses à destination et en provenance du service de grand modèle de langage (LLM) qui sont marquées comme contenu offensant.
Figure 5. Pourcentage marqué comme offensant - Total des occurrences de contenu offensant
- Cette zone du tableau de bord affiche le nombre total d’occurrences de contenu offensant pour les compétences et la plage de dates sélectionnées.
Figure 6. Total des occurrences de contenu offensant - Catégories de contenu offensant
- Cette zone du tableau de bord affiche la répartition des occurrences de contenu offensant par catégories. Si le contenu est considéré comme offensant dans plus d’une catégorie, par exemple, toxique et diffamatoire, l’occurrence est comptabilisée individuellement dans les deux catégories. Pour en savoir plus sur les catégories de contenu offensant, reportez-vous à la section .
Figure 7. Catégories de contenu offensant - Occurrences de contenus offensants par compétence
- Cette zone du tableau de bord affiche le nombre d’occurrences de contenu offensant au fil du temps selon les compétences dans lesquelles le contenu est détecté.
Figure 8. Occurrences de contenu offensant par compétence
Visualisations de l’injection d’invite
- Latence ajoutée par GuardRail
- Cette zone du tableau de bord affiche la latence moyenne résultant du garde-fou d’injection d’invite active pour les compétences et la plage de dates sélectionnées.
Figure 9. Latence ajoutée au garde-fou pour l’injection d’invite - Pourcentage marqué comme injection d'invite
- Cette zone du tableau de bord affiche le pourcentage de demandes et de réponses à destination et en provenance du service LLM qui sont marquées comme contenu offensant.
Figure 10. Pourcentage marqué comme injection d’invite - Nombre total d’occurrences de l’injection d’invite
- Cette zone du tableau de bord affiche le nombre total d’occurrences de contenu offensant pour les compétences et la plage de dates sélectionnées.
Figure 11. Nombre total d'occurrences de l'injection d'invite - Occurrences d'injection rapide par compétence
- Cette zone du tableau de bord affiche le nombre d’occurrences d’injection d’invite au fil du temps par les compétences pour lesquelles des tentatives d’injection d’invite ont été détectées.
Figure 12. Occurrences d'injection rapide par compétence