Flux d’évaluation pour les évaluations par lots
L’évaluation par lots permet aux administrateurs Eval d’évaluer jusqu’à 100 conversations d’Agent virtuel terminées à la fois, en fonction d’une requête enregistrée.
Nom du flux : Exécuter l’évaluation du lot.
Le flux crée des enregistrements d’évaluation et appelle des Now Assist compétences pour chaque conversation éligible, reflétant la logique d’évaluation de conversation unique, mais à l’échelle. Il applique les exclusions de champ d’application RH, la validation des rubriques/catégories, les règles de construction des transcriptions, les exclusions précoces des agents actifs et la notation asynchrone par compétences.
Les évaluations des lots sont effectuées selon la logique suivante :
- Table : Jeu d’évaluation [sn_na_conv_eval_evaluation_set]
- Condition : l’état devient En cours et Type d’évaluation = Conversation
- Ensemble d’évaluation avec :
- Filtre de requête : requête qui cible les conversations à évaluer (par exemple, sys_cs_conversation filtres).
- Type d’évaluation : conversation
- État : En cours (jusqu’à démarrer)
- LLM/Skills : classifieur de rubriques de messagerie instantanée, ainsi que les compétences d’évaluation énumérées ci-dessous.
- Lit le filtre de requête et échantillonne aléatoirement jusqu’à 100 conversations.
- Ignore les conversations déjà évaluées.
- Exclut les interactions dans le champ d’application des RH.
- Utilise le classifieur de rubriques de messagerie instantanée pour valider l’éligibilité à l’évaluation et extrait la rubrique et la catégorie.
- Crée une transcription avec inclusion contrôlée d’articles et de sources de catalogue, et applique des exclusions précoces d’agents Knowledge actifs.
- Crée un enregistrement d’évaluation et invoque de façon asynchrone toutes les compétences d’évaluation sélectionnées, en écrivant les scores et la justification des mesures.
Séquence d’exécution :
- Objet : Clause de garde.
- Logique : recherchez l’enregistrement de l’ensemble d’évaluation et vérifiez le champ de filtre de requête.
- Si le filtre de requête est présent : Passez à l’action 2.
- Si vide : Arrêter et éventuellement journaliser Aucune requête fournie.
- Objectif : sélectionnez un échantillon aléatoire et limité de conversations dans la requête fournie.
- Logique:
- Exécutez la requête pour obtenir les enregistrements de conversation correspondants.
- Sélectionnez au hasard jusqu’à 100 conversations.
- Si >100 correspondent, plafonnez à 100.
- Si <100, sélectionnez Tout.
- Validez la requête ; Si elle n’est pas valide, renvoie la valeur Faux et un tableau vide ou partiel.
- Sorties:
- Réussite : Vrai/Faux
- conversation_ids : tableau de sys_ids (max. 100)
- Si réussite = vrai : Passer à l’action 3 ; Sinon, arrêtez et enregistrez l’erreur de validation.
- Objectif : Éviter les évaluations en double.
- Logique : pour chaque conversation sys_id, recherchez sn_na_conv_eval_evaluation d’enregistrements existants indiquant qu’elle est déjà évaluée ou en cours (choix d’implémentation : état différent d’Annulé/Échoué).
- S’il n’a pas été évalué précédemment : Passez à l’action 4 pour cette conversation.
- S’il a déjà été évalué : ignorez cette conversation ou consignez éventuellement Déjà évalué.
- Objectif : appliquer l’exclusion du champ d’application RH.
- Logique : résolvez l’interaction liée à la conversation. Si son périmètre d’application contient hr, ignorez la conversation.
- Si le champ d’application ne contient pas hr : Passez à l’action 5.
- Objectif : Construire la transcription finale, au niveau de la minute, et déterminer les compétences et les garde-fous en aval.
- Étapes :
- Regrouper tous les messages de conversation.
- Balisez les messages utilisateur en tant que [Utilisateur] : et les messages de Virtual Agent en tant que [Agent virtuel] :
- Knowledge des articles :
- Si les résultats Genius font référence à Knowledge des articles, interrogez l’article Knowledge et remplacez l’extrait Genius par le corps entier de l’article.
- Annoter avec [Virtual Agent] : articles d’aide pour la requête utilisateur : et envelopper le contenu dans Article_Start et Article_End.
- Contraintes :
- Si la base de connaissances est incluse dans le périmètre RH ou inaccessible, ne l’évaluez pas (ignorez la conversation).
- Tronquez le corps de l’article à un maximum de 10 000 mots.
- Si la source du contenu de la base de connaissances est constituée de fichiers joints (PDF/Word/Txt), revenez au résultat Genius plutôt qu’au contenu complet du fichier.
- Éléments de catalogue :
- Si les résultats Genius font référence à des éléments de catalogue, interrogez sc_cat_item et créez une chaîne : nom du catalogue, description brève, description.
- Annoter avec [Virtual Agent] : choisissez l’une des options ci-dessous et incluez l’ordre de citation.
- Exclusions des agents actifs :
- Si le premier message utilisateur demande un agent actif, ignorez l’évaluation.
- Si un agent actif est invoqué dans les 120 premiers mots, ignorez l’évaluation.
- Sorties:
- ExecuteEvaluation : vrai/faux (résultat post-garde-fou)
- Transcription de la messagerie instantanée
- Knowledge Articles référencés
- Éléments de catalogue référencés
- Première occurrence d’agent actif : Sys_id du message de conversation (le cas échéant)
- Compétences à invoquer :
- Évaluation de la messagerie instantanée Coherence
- Clarté Évaluation de messagerie instantanée
- Rétention du contexte
- Remplissage inadéquat des créneaux Évaluation de messagerie instantanée
- Précision de l’intention Évaluation de la messagerie instantanée
- Conversation fluide Évaluation de messagerie instantanée
- Hallucination de véracité Évaluation de messagerie instantanée
- Journaux supplémentaires
- Si ExecuteEvaluation = true : Passer à l’action 7 ; Sinon, ignorez la conversation.
- Objectif : création d’une branche vers l’enregistrement.
- Logique : Si ExecuteEvaluation de l’action 6 est vrai, passez à l’action 8.
- Objectif : valider si la conversation doit être évaluée et extraire des étiquettes de haut niveau.
- Logique:
- Créez une transcription légère à partir de sys_cs_message pour l’entrée de classification.
- Invoquez la compétence de classifieur de rubriques de messagerie instantanée avec la transcription.
- Recevoir:
- Exécuter l’évaluation : vrai/faux
- Nom de la rubrique
- Catégorie : IT ou RH
- Si Exécuter l’évaluation = vrai : Passer à l’action 6.
- Si faux : ignorer la conversation et consigner la décision du classifieur.
- Objectif : conserver une entrée d’évaluation pour cette conversation.
- Tableau : sn_na_conv_eval_evaluation
- Population sur le terrain :
- Conversation de document : référence de conversation
- État : traitement
- Sujet : à partir de l’action 5
- Catégorie : à partir de l’action 5
- Base de connaissances référée : à partir de l’action 6
- Catalogue référencé : à partir de l’action 6
- Première occurrence d’agent actif : à partir de l’action 6
- Type : synthèse de la messagerie instantanée
- Utilisateur : initiateur de la conversation
- Journal des messages : journaux supplémentaires de l’action 6
- En cas de réussite : Passez à l’action 9.
- Objectif : exécuter chaque compétence d’évaluation sélectionnée.
- Pour chaque compétence de la liste de l’action 6 :
- Action 10 : invokeApiDefinition
- Entrées : nom de la compétence, conversation, transcription, ID d’évaluation
- Comportement:
- Invoquez la compétence de Now Assist manière asynchrone.
- Le post-processeur écrit les résultats dans sys_generative_ai_response_validator.
- Extraire les champs de réponse JSON :
- Score
- Motif du score
- Exemples à l’appui du raisonnement
- Créez des enregistrements de mesures enfants dans sn_na_conv_eval_evaluation_metrics liés à l’évaluation parente.
- Action 11 : Attendre
Faites une pause de sept secondes avant de passer à la compétence suivante pour gérer les limites de taux ou la limitation.
- Action 10 : invokeApiDefinition