Caching für Now Assist Q&A Genius-Ergebnisse

  • Freigeben Version: Yokohama
  • Aktualisiert 6. Februar 2025
  • 7 Minuten Lesedauer
  • KI-Suche stellt zwei Caches für die Abfragezeit bereit, um die Suchleistung für Now Assist F&A Genius-Ergebnisse zu verbessern. Durch das Caching kann KI-Suche zuvor generierte Now Assist F&A Genius-Ergebnisantworten zurückgeben, ohne Wissensartikel zur Antwortgenerierung an Now LLM Service zu senden.

    Now Assist Übersicht über das Zwischenspeichern von F&A-Genius-Ergebnissen

    Wenn eine Suchabfrage eine Now Assist F&A Genius-Ergebniskonfiguration auslöst, verwendet KI-Suche die Suchabfrage und die sys_id des am besten bewerteten Suchergebnisses der Suche nach Wissensartikeln, um nach zwischengespeicherten Artikelzusammenfassungen zu suchen. Wenn in den aktiven Caches keine Artikelzusammenfassung gefunden wird, sendet KI-Suche die Suchabfrage und die sys_id des Artikels an Now LLM Service zur Antwortgenerierung.
    Hinweis:
    Standardmäßig verwendet KI-Suche nur den Cache der ersten Ebene und Now LLM Service, wenn Now Assist F&A Genius-Ergebnisantworten gesucht werden. Um den Cache der zweiten Ebene zu aktivieren oder die Verwendung von Now LLM Servicezu deaktivieren, können Administratoren den Betriebsmodus für die Caches wie in diesem Thema beschrieben ändern.

    Die Abfragezeit-Caches unterstützen nur englischsprachige Suchen, Wissensartikel und Antworten.

    Cache-Ebenen

    Der Cache enthält zwei Ebenen, die auf unterschiedliche Weise arbeiten, um die Suchleistung für Now Assist F&A Genius-Ergebnisse zu verbessern.
    Cache der ersten Ebene

    Der Cache der ersten Ebene enthält eine Liste von Schlüssel-Wert-Paaren, die für den schnellen Zugriff im Speicher gespeichert sind. Jeder Cache-Eintrag hat einen Schlüssel, der eine Suchabfrage und die sys_id des von dieser Abfrage zurückgegebenen Wissensartikels enthält. Der Wert des Cache-Eintrags enthält die Zusammenfassung, die von Now LLM Service für die angegebene Suchabfrage und den angegebenen Wissensartikel generiert wurde.

    Bei der Überprüfung des Cache der ersten Ebene vergleicht KI-Suche Ihre Suchabfrage und die sys_id des Suchergebnisses für Wissensartikel mit den Cache-Eintragsschlüsseln. Wenn ein passender Schlüssel gefunden wird, wird die Artikelzusammenfassung aus dem entsprechenden Cache-Eintragswert zurückgegeben. Andernfalls wird der Cache der zweiten Ebene überprüft.
    Hinweis:
    Der Cache der ersten Ebene gibt nur dann ein Ergebnis zurück, wenn Ihre Suchabfrage eine exakte lexikalische Übereinstimmung mit der zwischengespeicherten Suchabfrage ist. Wenn Sie beispielsweise nach der Vermeidung von Betrug suchen, erhalten Sie für einen zwischengespeicherten Eintrag mit der Suchabfrage, wie Betrug verhindert werden kann, kein Ergebnis, da die beiden Suchabfragen nicht dieselben Begriffe enthalten.
    Cache der zweiten Ebene

    Der Cache der zweiten Ebene enthält eine Tabelle, die als indizierte KI-Suche -Quelle konfiguriert ist. Jeder Datensatz in dieser Tabelle ist ein Cache-Eintrag und enthält eine Suchabfrage, die sys_id für ein zugeordnetes Suchergebnis eines Wissensartikels, die für diese Abfrage und den Wissensartikel generierte Zusammenfassung und andere Felder wie angeheftet, sys_updated_on und run_as. KI-Suche aktualisiert den Index für diese Tabelle, wenn ihre Datensätze erstellt, aktualisiert oder gelöscht werden. Diese Indexaktualisierung kann bis zu einer Minute dauern.

    Bei der Überprüfung des Cache der zweiten Ebene fragt KI-Suche die indizierte Tabelle ab und sucht nach einem Eintrag, der Ihrer Suchabfrage und der sys_id des Suchergebnisses für den Wissensartikel entspricht. Wenn ein übereinstimmender Eintrag gefunden wird, wird die in der indizierten Tabelle gespeicherte Artikelzusammenfassung zurückgegeben. Andernfalls werden Ihre Suchanfrage und das Ergebnis der Suche nach dem Wissensartikel an Now LLM Serviceübermittelt.
    Hinweis:
    Im Gegensatz zum Cache der ersten Ebene vergleicht der Cache der zweiten Ebene die Bedeutung von Suchabfragen mithilfe der semantischen Vektorsuche, sodass Sie möglicherweise ein Cache-Ergebnis erhalten, auch wenn Ihre Suchabfrage keine exakte lexikalische Übereinstimmung mit der zwischengespeicherten Suchabfrage aufweist. Wenn Sie beispielsweise nach der Vermeidung von Betrug suchen, erhalten Sie möglicherweise das Ergebnis für einen zwischengespeicherten Eintrag mit der Suchabfrage, wie Betrug verhindert werden kann, da die Bedeutung der beiden Suchabfragen ähnlich ist. Weitere Informationen zur semantischen Vektorsuche finden Sie unter Semantische Vektorsuche in KI-Suche.

    Vorteile von Caching

    Das Zwischenspeichern von Now Assist F&A Genius-Ergebnissen bietet die folgenden Vorteile:
    • Verringert die durchschnittliche Antwortzeit für allgemeine Now Assist F&A-Genius-Ergebnisantworten
    • Verringert den Verbrauch der Now Assist -Berechtigung, indem die Anzahl der Suchabfrageergebnisse reduziert wird, die an die Now LLM Service für Now Assist F&A-Antwortextraktion gesendet werden
    • Erhöht die Wahrscheinlichkeit, dass eine Now Assist F&A Genius-Ergebnisantwort zurückgegeben wird
    • Verbessert die Suchkonsistenz, indem für ähnliche Suchen dieselbe Now Assist F&A Genius-Ergebnisantwort zurückgegeben wird

    Inhaltssicherheit für zwischengespeicherte Abfragen

    Da KI-Suche Einschränkungen der Inhaltssicherheit auf Ihre Suche anwendet, bevor Wissensartikel abgeglichen und die Caches überprüft werden, gibt keiner der Caches Treffer für Wissensartikel zurück, auf die Sie keinen Zugriff haben. Ausführliche Informationen zum Inhaltssicherheitsmodell von KI-Suchefinden Sie unter Inhaltssicherheit in KI-Suche.

    Cache-Modi

    Die Now Assist Q&A Genius-Ergebnisantwort-Caches unterstützen die folgenden Betriebsmodi:
    • off: Verwenden Sie den Cache der ersten Ebene und Now LLM Service, um Now Assist F&A Genius-Ergebnisantworten zu finden.

      KI-Suche sucht im Cache der ersten Ebene nach Now Assist F&A Genius-Ergebnisantworten, die genau mit Ihrer Suchabfrage und dem Wissensartikelergebnis übereinstimmen. Wenn keine übereinstimmende Antwort gefunden wird, werden Ihre Abfrage und die sys_id des Wissensartikels zur Antwortgenerierung an Now LLM Service gesendet.

      Now Assist F&A Genius-Ergebnisantworten, die von Now LLM Service generiert werden, füllen den Cache der ersten Ebene aus.

      Bei Verwendung von Dynamische ÜbersetzungKI-Suche umgeht die Caches und fragt Now LLM Service ab, um eine Antwort für das F&A-Genius-Ergebnis Now Assist zu generieren.

    • offline: Verwenden Sie die Caches der ersten und zweiten Ebene, um Now Assist F&A Genius-Ergebnisantworten zu finden. Senden Sie keine Abfragen an Now LLM Service.

      KI-Suche sucht im Cache der ersten Ebene nach Now Assist F&A Genius-Ergebnisantworten, die genau mit Ihrer Suchabfrage und dem Wissensartikelergebnis übereinstimmen. Wenn keine passende Antwort gefunden wird, verwendet es die semantische Vektorsuche, um im Cache der zweiten Ebene nach Antworten zu suchen, die der Bedeutung Ihrer Abfrage entsprechen. Wenn keine zwischengespeicherten Antworten mit Ihrer Abfrage und dem Ergebnis des Wissensartikels übereinstimmen, gibt KI-Suche keine Antwort für das F&A Genius-Ergebnis Now Assist zurück.

      Now Assist F&A Genius-Ergebnisantworten, die im Cache der zweiten Ebene gefunden werden, füllen den Cache der ersten Ebene.

      Bei Verwendung von Dynamische ÜbersetzungKI-Suche umgeht die Caches und gibt keine Antwort für das F&A Genius-Ergebnis Now Assist zurück.

    • online: Verwenden Sie die Caches der ersten und zweiten Ebene sowie Now LLM Service, um Now Assist F&A Genius-Ergebnisantworten zu finden.

      KI-Suche sucht im Cache der ersten Ebene nach Now Assist F&A Genius-Ergebnisantworten, die genau mit Ihrer Suchabfrage und dem Wissensartikelergebnis übereinstimmen. Wenn keine passende Antwort gefunden wird, verwendet es die semantische Vektorsuche, um im Cache der zweiten Ebene nach Antworten zu suchen, die der Bedeutung Ihrer Abfrage entsprechen. Wenn keine zwischengespeicherten Antworten mit Ihrer Abfrage und dem Ergebnis des Wissensartikels übereinstimmen, übermittelt KI-Suche die sys_id der Abfrage und des Artikels an den Now LLM Service, um die Antwort zu generieren.

      Now Assist F&A Genius-Ergebnisantworten, die von Now LLM Service generiert werden, füllen den Cache der ersten und zweiten Ebene aus.

      Bei Verwendung von Dynamische Übersetzung, KI-Suche umgeht die Caches und fragt Now LLM Service ab, um eine Antwort für das F&A-Genius-Ergebnis Now Assist zu generieren.

    Der Standardbetriebsmodus ist off.

    Administratoren können den Betriebsmodus für die Now Assist F&A Genius-Ergebnisantwort-Caches ändern, indem sie den Wert für die Systemeigenschaft sn_ais_assist.semantic_cache_mode auf off, offlineoder onlinefestlegen. Einzelheiten zu den Einstellungen für Systemeigenschaften finden Sie unter Systemeigenschaft hinzufügen.

    Weitere Informationen zur Verwendung von Dynamische Übersetzung mit Now Assist Genius-Ergebnissen finden Sie unter Dynamische Übersetzung für Now Assist Genius-Ergebnisse für F&A.

    Geplante Aufgabe für die Cache-Verwaltung

    Die geplante Aufgabe Update Semantic Cache wird täglich ausgeführt, um die folgenden Aufgaben auszuführen:
    • Füllen Sie den Cache der zweiten Ebene mit Ergebnissen für die am häufigsten übermittelten Abfragen aus, die in der Suchsignaltabelle für Suchereignisse [sys_search_event] gefunden wurden. Weitere Informationen zu dieser Tabelle finden Sie unter Signaltabellen durchsuchen.
    • Löschen Sie alle nicht angehefteten Cache-Einträge der zweiten Ebene, die in den letzten sieben Tagen nicht verwendet wurden. Suchadministratoren können Ergebnisse in der Cache-Tabelle der zweiten Ebene anheften, um zu verhindern, dass sie gelöscht werden. Weitere Informationen zu diesem Verfahren finden Sie unter Heften Sie zwischengespeicherte Antworten für Now Assist Genius-Ergebnisse für F&A an.

    Heften Sie zwischengespeicherte Antworten für Now Assist Genius-Ergebnisse für F&A an

    Verbessern Sie die Leistung für Now Assist F&A Genius-Ergebnisse, indem Sie häufig verwendete Antworten im Cache der zweiten Ebene anheften. Durch das Anheften einer Antwort wird diese vom Löschmechanismus des Cache befreit.

    Vorbereitungen

    Die Anwendung Now Assist in KI-Suche ServiceNow® Store muss auf Ihrer Instanz von installiert sein. Weitere Informationen zur Installation dieser Anwendung finden Sie unter Now Assist in KI-Sucheinstallieren.

    Erforderliche Rolle: ais_admin

    Warum und wann dieser Vorgang ausgeführt wird

    Suchadministratoren können Einträge im Cache der zweiten Ebene für Now Assist F&A Genius-Ergebnisantworten anheften. Die geplante Aufgabe Update Semantic Cache ignoriert angeheftete Einträge beim Löschen des Cache der zweiten Ebene.

    Das Anheften häufig verwendeter Einträge verbessert die Suchleistung, indem KI-Suche aktiviert wird, um zuvor generierte Now Assist F&A Genius-Ergebnisantworten zurückzugeben, ohne Wissensartikel zur Antwortgenerierung an Now LLM Service zu senden.

    Weitere Informationen zum Cache für Genius-Ergebnisantworten für F&A der zweiten Ebene Now Assist und zu seiner Verwendung finden Sie unter Caching für Now Assist Q&A Genius-Ergebnisse.

    Prozedur

    1. Navigieren Sie zu KI-SucheNow Assist in der Listenansicht der Tabelle „Semantischer Cache [sn_ais_assist_semantic_cache]“.
      1. Wählen Sie Alleaus.
      2. Geben Sie im Feld Filtersn_ais_assist_semantic_cache.listein.
      3. Drücken Sie die Eingabetaste.
      Jeder Datensatz in dieser Tabelle stellt einen Cache-Eintrag der zweiten Ebene dar. Die Tabelle wird mit Now Assist F&A Genius-Ergebnisantworten ausgefüllt, die zuvor von Now LLM Servicegeneriert wurden.
    2. Führen Sie für jeden Cache-Eintragsdatensatz, den Sie anheften möchten, die folgenden Schritte aus:
      1. Öffnen Sie den Cache-Eintragsdatensatz, indem Sie ihn in der Listenansicht auswählen.
      2. Legen Sie den Wert des Felds „Angeheftet “ des Datensatzes auf „true“fest.
      3. Wählen Sie Aktualisieren.

    Ergebnisse

    Die geplante Aufgabe Update Semantic Cache ignoriert Ihre angehefteten Einträge beim Löschen des Cache der zweiten Ebene.