Mise en cache des Now Assist résultats Genius des questions-réponses

  • Rversion finale: Washingtondc
  • Mis à jour 1 févr. 2024
  • 9 minutes de lecture
  • Recherche IA fournit deux caches de requête pour améliorer les performances de recherche pour Now Assist les résultats Genius Q&R. La mise en cache permet Recherche IA de renvoyer les réponses aux résultats Genius de questions-réponses précédemment générées Now Assist sans soumettre d’articles de la base de connaissances à la génération de Now LLM réponses.

    Vue d'ensemble

    Lorsqu’une requête de recherche déclenche une Now Assist configuration de résultat Genius de questions-réponses, Recherche IA utilise la requête de recherche et le sys_id du résultat de recherche d’article de la base de connaissances le mieux classé de la recherche pour rechercher des résumés d’articles mis en cache. Si aucun résumé d’article n’est trouvé dans les caches actifs, Recherche IA envoie la requête de recherche et le sys_id d’article à la génération de Now LLM réponse.
    Remarque :
    Par défaut, Recherche IA utilise uniquement le cache de premier niveau et le lors de la Now LLM recherche des Now Assist réponses de résultat Genius de questions-réponses. Pour activer le cache de deuxième niveau ou désactiver l’utilisation de , Now LLMles administrateurs peuvent modifier le mode de fonctionnement des caches comme décrit dans cette rubrique.

    Niveaux de caches

    Le cache comprend deux niveaux qui fonctionnent de différentes manières pour améliorer les performances de recherche pour Now Assist les résultats Genius de questions-réponses.
    Cache de premier niveau

    Le cache de premier niveau comprend une liste de paires clé-valeur stockées en mémoire pour un accès rapide. Chaque entrée de cache a une clé qui inclut une requête de recherche et le sys_id d’un article de la base de connaissances renvoyé par cette requête. La valeur de l’entrée de cache inclut le résumé généré par le Now LLM pour la requête de recherche et l’article de la base de connaissances spécifiés.

    Lors de la vérification du cache de premier niveau, Recherche IA compare votre requête de recherche et le sys_id de vos résultats de recherche d’article de la base de connaissances aux clés d’entrée du cache. Si elle trouve une clé correspondante, elle renvoie le résumé de l’article à partir de la valeur d’entrée de cache correspondante. Sinon, il vérifie le cache de deuxième niveau.
    Remarque :
    Le cache de premier niveau génère un résultat uniquement lorsque votre requête de recherche correspond exactement au lexique de la requête de recherche mise en cache. Par exemple, si vous recherchez pour éviter les escroqueries , vous n’obtiendrez pas de résultat pour une entrée mise en cache avec une requête de recherche sur la prévention des escroqueries , car les deux requêtes de recherche ne contiennent pas les mêmes termes.
    Cache de second niveau

    Le cache de deuxième niveau comprend une table configurée en tant que Recherche IA source indexée. Chaque enregistrement de cette table est une entrée de cache et comprend une requête de recherche, le sys_id d’un résultat de recherche d’article de la base de connaissances associé, le résumé généré pour cette requête et cet article de la base de connaissances, ainsi que d’autres champs tels que Épinglé, sys_updated_on et run_as. Recherche IA Met à jour l’index de cette table chaque fois que ses enregistrements sont créés, mis à jour ou supprimés. Cette opération de mise à jour de l’index peut prendre jusqu’à une minute.

    Lors de la vérification du cache de deuxième niveau, Recherche IA interroge la table indexée, recherchant une entrée qui correspond à votre requête de recherche et au sys_id de votre résultat de recherche d’article de la base de connaissances. S’il trouve une entrée correspondante, il renvoie le résumé de l’article stocké dans la table indexée. Sinon, il soumet votre requête de recherche et le résultat de recherche d’article de la base de connaissances au Now LLM.
    Remarque :
    Contrairement au cache de premier niveau, le cache de deuxième niveau compare les significations des requêtes de recherche à l’aide de la recherche sémantique, de sorte que vous pouvez obtenir un résultat de cache même si votre requête de recherche n’est pas une correspondance lexicale exacte pour la requête de recherche mise en cache. Par exemple, si vous recherchez pour éviter les escroqueries , vous pouvez obtenir le résultat d’une entrée mise en cache avec une requête de recherche sur la prévention des escroqueries , car les significations des deux requêtes de recherche sont similaires. Pour plus d’informations sur la recherche sémantique, consultez Recherche sémantique dans Recherche IA.

    Avantages de la mise en cache

    La mise en cache des Now Assist résultats Genius de questions-réponses fournit les avantages suivants :
    • Diminue le délai de réponse moyen pour les réponses courantes Now Assist aux questions-réponses Résultat Genius
    • Réduit la Now Assist consommation d’autorisation en réduisant le nombre de résultats de requête de recherche envoyés à l’extraction Now LLMNow Assist des réponses aux questions-réponses
    • Augmente la probabilité de renvoyer une Now Assist réponse de résultat Genius de questions-réponses
    • Améliore la cohérence de la recherche en renvoyant la même Now Assist réponse de résultat Genius aux questions-réponses pour des recherches similaires

    Sécurité du contenu pour les requêtes mises en cache

    Étant donné qu’il Recherche IA applique des restrictions de sécurité du contenu à votre recherche avant qu’elle ne corresponde aux articles de la base de connaissances et vérifie les caches, aucun des deux caches ne renvoie de résultats pour les articles de la base de connaissances auxquels vous n’avez pas accès. Pour en savoir plus sur Recherche IAle modèle de sécurité du contenu, reportez-vous à la section Sécurité du contenu dans Recherche IA.

    Modes de cache

    Les Now Assist caches de réponses des résultats Genius de questions-réponses prennent en charge les modes de fonctionnement suivants :
    • off: utiliser le cache de premier niveau et le pour trouver Now Assist les Now LLM réponses aux questions-réponses de résultat Genius.

      Recherche IA recherche dans le cache Now Assist de premier niveau les réponses de résultat Genius aux questions-réponses qui correspondent exactement à votre requête de recherche et au résultat de l’article de la base de connaissances. S’il ne trouve pas de réponse correspondante, il envoie votre requête et votre article de la base de connaissances sys_id à la génération de Now LLM réponses.

      Now Assist Les réponses de résultat Genius de questions-réponses générées par le Now LLM renseignent le cache de premier niveau.

    • offline: utiliser les caches de premier et de deuxième niveau pour trouver Now Assist les réponses aux questions-réponses de résultat Genius. Ne soumettez pas de requêtes au Now LLMfichier .

      Recherche IA recherche dans le cache Now Assist de premier niveau les réponses de résultat Genius aux questions-réponses qui correspondent exactement à votre requête de recherche et au résultat de l’article de la base de connaissances. S’il ne trouve pas de réponse correspondante, il utilise la recherche sémantique pour rechercher des réponses qui correspondent au sens de votre requête dans le cache de deuxième niveau. Si aucune réponse mise en cache ne correspond au résultat de votre requête et de votre article de la base de connaissances, Recherche IA aucune réponse ne renvoie pour le résultat Genius de questions-réponses Now Assist .

      Now Assist Les réponses des résultats Genius des questions-réponses trouvées dans le cache de deuxième niveau renseignent le cache de premier niveau.

    • online: utiliser les caches de premier et de deuxième niveau et le pour trouver Now Assist les Now LLM réponses aux questions-réponses de résultat Genius.

      Recherche IA recherche dans le cache Now Assist de premier niveau les réponses de résultat Genius aux questions-réponses qui correspondent exactement à votre requête de recherche et au résultat de l’article de la base de connaissances. S’il ne trouve pas de réponse correspondante, il utilise la recherche sémantique pour rechercher des réponses qui correspondent au sens de votre requête dans le cache de deuxième niveau. Si aucune réponse mise en cache ne correspond au résultat de votre requête et de l’article de la base de connaissances, Recherche IA envoie la requête et l’article sys_id à la génération de Now LLM réponses.

      Now Assist Les réponses de résultat Genius de questions-réponses générées par le Now LLM renseignent les caches de premier et de deuxième niveau.

    Le mode de fonctionnement par défaut est off.

    Les administrateurs peuvent modifier le mode de fonctionnement des Now Assist caches de réponses des résultats Genius de questions-réponses en définissant la valeur de la sn_ais_assist.semantic_cache_mode propriété système sur off, offlineou online. Pour en savoir plus sur les paramètres des propriétés système, reportez-vous à la section Ajouter une propriété système.

    Tâche planifiée pour la gestion du cache

    La Update Semantic Cache tâche planifiée s’exécute quotidiennement pour effectuer les tâches suivantes :
    • Remplir le cache de deuxième niveau avec les résultats des requêtes les plus fréquemment soumises trouvées dans la table Signal de recherche de l’événement de recherche [sys_search_event]. Pour en savoir plus sur cette table, reportez-vous à Rechercher les tables de signaux.
    • Purger toutes les entrées de cache de second niveau non épinglées qui n’ont pas été utilisées au cours des sept derniers jours. Les administrateurs de Search peuvent épingler les résultats dans la table de cache de deuxième niveau pour empêcher leur purge. Pour plus de détails sur cette procédure, reportez-vous à la section Épingler les réponses mises en cache pour Now Assist les questions-réponses Résultats Genius.

    Épingler les réponses mises en cache pour Now Assist les questions-réponses Résultats Genius

    Améliorez les performances des Now Assist résultats Genius de questions-réponses en épinglant les réponses fréquemment utilisées dans le cache de deuxième niveau. L’épinglage d’une réponse l’exempte du mécanisme de purge du cache.

    Avant de commencer

    Rôle requis : ais_admin

    Pourquoi et quand exécuter cette tâche

    Les administrateurs de recherche peuvent épingler des entrées dans le cache de deuxième niveau pour Now Assist les réponses de résultat Genius aux questions-réponses. La Update Semantic Cache tâche planifiée ignore les entrées épinglées lors de la purge du cache de deuxième niveau.

    L’épinglage des entrées fréquemment utilisées permet d’améliorer les performances de recherche en permettant Recherche IA de renvoyer les réponses aux résultats Genius de questions-réponses précédemment générées Now Assist sans soumettre d’articles de la base de connaissances à la génération de Now LLM réponses.

    Pour en savoir plus sur le cache de réponse de deuxième niveau Now Assist des résultats Genius Q&R et son utilisation, reportez-vous à Mise en cache des Now Assist résultats Genius des questions-réponses.

    Procédure

    1. Accédez à la vue de liste de la table dans Recherche IA le Now Assist cache sémantique [sn_ais_assist_semantic_cache].
      1. Sélectionnez Tout.
      2. Dans le filtre de navigation, saisissez sn_ais_assist_semantic_cache.list.
      3. Appuyez sur Entrée.
      Chaque enregistrement de cette table représente une entrée de cache de second niveau. La table est renseignée avec Now Assist les réponses de résultat Genius aux questions-réponses précédemment générées par le Now LLM.
    2. Pour chaque enregistrement d’entrée de cache que vous souhaitez épingler, procédez comme suit :
      1. Ouvrez l’enregistrement d’entrée de cache en le sélectionnant dans la vue de liste.
      2. Définissez la valeur du champ Épinglé de l’enregistrement sur vrai.
      3. Sélectionnez Mettre à jour.

    Résultats

    La Update Semantic Cache tâche planifiée ignore vos entrées épinglées lors de la purge du cache de deuxième niveau.