Composants installés avec le tableau de bord d’évaluation
Plusieurs types de composants font partie de l’onglet Évaluation, notamment les travaux planifiés, les tables, les propriétés système et les flux.
Travaux planifiés installés
| Tâche planifiée | Description |
|---|---|
|
CE : remplir les agrégats de valeurs Messageries instantanées : quotidien |
Ce script planifié s’exécute quotidiennement et sélectionne aléatoirement 1 000 conversations à partir des conversations d’hier. Ensuite, pour chaque conversation, cette tâche extrait la durée de la messagerie instantanée et la classe en petite, moyenne ou grande. Il classifie également les messageries instantanées dans lesquelles un article ou un Knowledge élément de catalogue a été invoqué. Pour la messagerie instantanée évaluée, elle classe également les conversations en fonction de leurs performances et renseigne ces données dans la table Agrégats de valeurs d’évaluation. |
| Calcul de la valeur d’évaluation : s’exécute une seule fois après l’installation | Supprime tous les enregistrements dans la table Agrégats de valeurs d’évaluation, exécute à nouveau les calculs et stocke la valeur agrégée dans la table Agrégats de valeurs d’évaluation. Les données datent de la date de la première évaluation. |
Tables installées
| Étiquette | Nom |
|---|---|
| Évaluation |
[sn_na_conv_eval_evaluation] |
| Configurations de l’évaluation |
[sn_na_conv_eval_evaluation_configurations] |
| Mesures d'évaluation |
[sn_na_conv_eval_evaluation_metrics] |
| Ensemble d’évaluations |
[sn_na_conv_eval_evaluation_set] |
|
Agrégats de valeurs d’évaluation |
[sn_na_conv_eval_evaluation_value_aggregates] |
Tables distantes installées
| Table | Description |
|---|---|
|
Calculs de la valeur de l’évaluateur de conversation [sn_na_conv_eval_st_value_calcs] |
Pour la requête donnée, la définition de cette table distante calcule les gains de temps et le pourcentage d’efficacité pour les petites, moyennes et grandes conversations. En outre, cela permet de gagner du temps et de gagner en efficacité lorsqu’un article ou un Knowledge élément de catalogue a été invoqué. |
| Calculs hebdomadaires de la conversation [sn_na_conv_eval_weekly_cals] |
Pour la requête donnée, la définition de cette table distante calcule les gains de temps et le pourcentage d’efficacité pour les petites, moyennes et grandes messageries instantanées pour différentes semaines de la plage de dates sélectionnée. En outre, cela renvoie les gains de temps et d’efficacité lorsqu’un article ou unKnowledge élément de catalogue a été invoqué pendant toutes les différentes semaines de la plage de dates sélectionnée. |
Propriétés système installées
| Propriété | Description |
|---|---|
|
sn_na_conv_eval. errorBandMinRecords |
Nombre minimum d’enregistrements requis pour calculer la bande d’erreur pour les écarts supérieur et inférieur. Par défaut, la valeur est 30. |
|
sn_na_conv_eval.evalWeights |
Contient des poids pour chaque mesure d’évaluation pour l’évaluation de la messagerie instantanée. Cette propriété est utilisée pour calculer les scores totaux ou composites pour les enregistrements d’évaluation. |
|
sn_na_conv_eval.maxEvaluateCount |
Nombre maximum d’enregistrements à évaluer en une journée. Par défaut, la valeur est 200. |
|
sn_na_conv_eval.total_sampled_conv_count |
Modifiez cette propriété pour contrôler le nombre total de conversations qui peuvent être échantillonnées pour le calcul de valeurs. Par défaut, la valeur est de 1000. |
| classifieur_chat_valeur.sn_na_conv_eval valeur |
Modifiez cette propriété pour changer la définition des petites, moyennes et grandes conversations. Par défaut, la valeur qu’il stocke est 4, 10. Ici, 4 et 10 signifient le nombre total de messages entrants. Moins de 4 messages entrants dans la table sys_cs_message pour une conversation signifie qu’il s’agit d’une petite conversation. Plus de 4 messages entrants et moins de 10 messages entrants signifient qu’il s’agit d’une conversation moyenne, et plus de 10 messages entrants signifie qu’il s’agit d’une grande conversation. |
| sn_na_conv_eval.ce_value_calculation_weights | Valeurs de poids du calcul de valeur pour chaque type de messagerie instantanée évaluée. |
| sn_na_conv_eval.eval_value_rerun_status | Réexécute les calculs de valeur une fois après l’installation. Cette propriété vérifie l’état du statut de nouvelle exécution de la valeur de l’évaluateur de conversation. S’il s’est exécuté, le script change la valeur de cette propriété système en faux. |
Règles métier installées
| Nom | Quand | Insérer | Mettre à jour | Conditions de filtre |
|---|---|---|---|---|
| Ajouter un message d’informations pour l’ensemble d’évaluations | après | VRAI | VRAI | stateCHANGESTOIn Progress^evaluation_type=conversation^EQ |
| Étendre la mesure d’étiquetage | avant | VRAI | VRAI | metric_type=Étiquetage^metric_nameINhelpfulness_chat_eval,intent_recognition_chat_eval,slot_filling_chat_eval,forgetfulness_chat_eval,hallucination_chat_eval,redundancy_chat_eval,deadlock_chat_eval,coherence_chat_eval^raw_scoreVALCHANGES^EQ |
| updateLabelingScoresOnEvaluation | après | VRAI | VRAI | metric_type=Étiquetage^raw_scoreVALCHANGES^metric_nameINhelpfulness_chat_eval,intent_recognition_chat_eval,slot_filling_chat_eval,forgetfulness_chat_eval,hallucination_chat_eval,redundancy_chat_eval,deadlock_chat_eval,coherence_chat_eval^EQ |
| Mettre à jour les scores d’écart | avant | VRAI | VRAI | metric_type=LLM Généré^scoreVALCHANGES^EQ |
| getAutoEvalCompositeScore | après | FAUX | VRAI | étatCHANGESTOComplete^total_scoreISEMPTY^EQ |
Flux installés
| Flux | Description |
|---|---|
|
Exécuter l’évaluation |
Effectue des évaluations lorsque les conversations sont terminées. Par défaut, le flux Exécuter l’évaluation est désactivé. Vous pouvez utiliser la tâche planifiée nocturne Exécuter des évaluations pour évaluer les messageries instantanées. Si vous souhaitez évaluer les messageries instantanées à la complétion de la messagerie instantanée, activez le flux Exécuter l’évaluation. |
| Exécuter l’évaluation du lot | Effectue des évaluations par lots, évaluant jusqu’à 100 conversations d’Agent virtuel terminées. Le flux est déclenché lorsque l’ensemble d’évaluations est créé ou mis à jour et que le type d’évaluation est Conversation. |
Actions de flux installées
| Action de flux | Description |
|---|---|
|
Randomiser les conversations |
Effectue une randomisation des conversations et renvoie 100 conversations de manière aléatoire à partir d’une requête donnée. |
| invokeApiDefinition | Invoque l’aptitude OneExtend dans le grand modèle de langage (LLM). |
| Évaluation du classifieur de messagerie instantanée | Indique le titre, la catégorie et indique si l’évaluation doit être exécutée. |
| buildTranscription | Construit la transcription à partir d’une conversation. |
| evalExecuteCondition | Vérifie si la transcription est suffisamment bonne pour être évaluée. |
Includes de script installés
| Includes de script | Description |
|---|---|
| evalExecuteCondition |
Utilisez cet include de script pour mettre à jour la condition d’évaluation. |
| evalUtils | Fonction d’utilité primaire pour l’évaluateur. |