Cache para Now Assist resultados de perguntas e respostas do Genius

Versão de lançamento: Yokohama

Atualizado 6 de fev. de 2025

9 min. de leitura

Pesquisa com IA fornece dois caches de tempo de consulta para melhorar o desempenho de pesquisa para Now Assist resultados do Genius de perguntas e respostas. O cache permite que Pesquisa com IA retorne respostas geradas anteriormente Now Assist do resultado das perguntas e respostas do Genius sem enviar artigos de conhecimento para o Serviço Now LLM para geração de resposta.

Now Assist Visão geral do cache de resultados do Genius para perguntas e respostas

Quando uma consulta de pesquisa aciona uma configuração Now Assist de resultado do Genius de perguntas e respostas, Pesquisa com IA usa a consulta de pesquisa e o sys_id do resultado da pesquisa de artigos de conhecimento com melhor classificação para procurar resumos de artigos armazenados em cache. Se nenhum resumo de artigo for encontrado nos caches ativos, Pesquisa com IA enviará a consulta de pesquisa e o sys_id do artigo para Serviço Now LLM para geração de resposta.

Nota:

Por padrão, Pesquisa com IA usa somente o cache de primeiro nível e o Serviço Now LLM ao encontrar Now Assist respostas do Genius Result das perguntas e respostas. Para habilitar o cache de segundo nível ou desabilitar o uso de Serviço Now LLM, os administradores podem mudar o modo operacional dos caches conforme descrito neste tópico.

Os caches de tempo de consulta oferecem suporte somente a pesquisas no idioma inglês, artigos de conhecimento e respostas.

Níveis de cache

O cache inclui dois níveis que funcionam de maneiras diferentes para melhorar o desempenho de pesquisa de Now Assist resultados do Genius de perguntas e respostas.

Cache de primeiro nível: O cache de primeiro nível compreende uma lista de pares de chave-valor armazenados na memória para acesso rápido. Cada entrada de cache tem uma chave que inclui uma consulta de pesquisa e o sys_id de um artigo de conhecimento retornado por essa consulta. O valor da entrada de cache inclui o resumo gerado pelo Serviço Now LLM para a consulta de pesquisa e o artigo de conhecimento especificados.

Ao verificar o cache de primeiro nível, Pesquisa com IA compara sua consulta de pesquisa e o sys_id do resultado da pesquisa do artigo de conhecimento com as chaves de entrada do cache. Se encontrar uma chave correspondente, ele retornará o resumo do artigo do valor de entrada de cache correspondente. Caso contrário, ele verificará o cache de segundo nível.
Nota:
O cache de primeiro nível só produz um resultado quando sua consulta de pesquisa é uma correspondência lexical exata para a consulta de pesquisa em cache. Por exemplo, se você pesquisar para evitar golpes, não obterá um resultado para uma entrada em cache com a consulta de pesquisa Como evitar golpes porque as duas consultas de pesquisa não contêm os mesmos termos.
Cache de segundo nível: O cache de segundo nível compreende uma tabela que está configurada como uma origem indexada Pesquisa com IA. Cada registro nesta tabela é uma entrada de cache e inclui uma consulta de pesquisa, o sys_id de um resultado de pesquisa de artigo de conhecimento associado, o resumo gerado para essa consulta e artigo de conhecimento e outros campos como fixado, sys_updated_on e run_as. Pesquisa com IA atualiza o índice desta tabela sempre que seus registros são criados, atualizados ou excluídos. Esta operação de atualização de índice pode levar até um minuto.

Ao verificar o cache de segundo nível, Pesquisa com IA consulta a tabela indexada, procurando uma entrada que corresponda à sua consulta de pesquisa e ao sys_id do resultado da pesquisa do artigo de conhecimento. Se encontrar uma entrada correspondente, ele retornará o resumo do artigo armazenado na tabela indexada. Caso contrário, ele enviará sua consulta de pesquisa e o resultado da pesquisa de artigos de conhecimento para o Serviço Now LLM.
Nota:
Ao contrário do cache de primeiro nível, o cache de segundo nível compara os significados das consultas de pesquisa usando a pesquisa vetorial semântica. Portanto, você pode obter um resultado de cache mesmo se a consulta de pesquisa não for uma correspondência lexical exata da consulta de pesquisa em cache. Por exemplo, se você pesquisar para evitar golpes, poderá obter o resultado de uma entrada em cache com a consulta de pesquisa Como evitar golpes porque os significados das duas consultas de pesquisa são semelhantes. Para obter mais informações sobre pesquisa vetorial semântica, consulte Pesquisa vetorial semântica no Pesquisa com IA.

Benefícios do cache

O armazenamento em cache para Now Assist resultados de perguntas e respostas do Genius oferece os seguintes benefícios:

Diminui o tempo médio de resposta para respostas comuns Now Assist do resultado das perguntas e respostas do Genius
Reduz o consumo de direitos de Now Assist, reduzindo o número de resultados de consulta de pesquisa enviados para Serviço Now LLM para Now Assist extração de resposta de perguntas e respostas
Aumenta a probabilidade de retornar uma resposta Now Assist do resultado das perguntas e respostas do Genius
Melhora a consistência da pesquisa retornando a mesma resposta Now Assist do resultado das perguntas e respostas do Genius para pesquisas semelhantes

Segurança de conteúdo para consultas em cache

Como Pesquisa com IA aplica restrições de segurança de conteúdo à sua pesquisa antes de corresponder a artigos de conhecimento e verificar os caches, nenhum dos caches retorna acertos para artigos de conhecimento aos quais você não tem acesso. Para obter detalhes completos sobre o modelo de segurança de conteúdo de Pesquisa com IA, consulte Segurança de conteúdo no Pesquisa com IA.

Modos de cache

Os Now Assist caches de resposta do resultado das perguntas e respostas do Genius são compatíveis com os seguintes modos operacionais:

off: use o cache de primeiro nível e Serviço Now LLM para encontrar respostas do Now Assistresultado das perguntas e respostas do Genius.

A Pesquisa com IA procurará no cache de primeiro nível as respostas do resultado das perguntas e respostas do Genius do Now Assist que correspondam exatamente à sua pesquisa e ao resultado do artigo de conhecimento. Se ela não encontrar uma resposta correspondente, enviará sua consulta e o sys_id do artigo de conhecimento ao Serviço Now LLM para a geração de resposta.

Now Assist Respostas do resultado de perguntas e respostas do Genius geradas por Serviço Now LLM preenchem o cache de primeiro nível.

Ao usar a Tradução dinâmica, a Pesquisa com IA ignora os caches e consulta o Serviço Now LLM para gerar uma resposta para o resultado de perguntas e respostas do Genius do Now Assist.
offline: use os caches de primeiro e segundo níveis para encontrar Now Assist respostas do resultado de perguntas e respostas do Genius. Não envie consultas para Serviço Now LLM.

A Pesquisa com IA procurará no cache de primeiro nível as respostas do resultado das perguntas e respostas do Genius do Now Assist que correspondam exatamente à sua pesquisa e ao resultado do artigo de conhecimento. Se ela não encontrar uma resposta correspondente, usará a pesquisa vetorial semântica para procurar respostas que correspondam ao significado da sua consulta no cache de segundo nível. Se nenhuma resposta em cache corresponder à sua consulta e ao resultado do artigo de conhecimento, a Pesquisa com IA não exibirá uma resposta para o resultado das perguntas e respostas do Genius do Now Assist.

Now Assist Respostas do resultado das perguntas e respostas do Genius encontradas no cache de segundo nível preenchem o cache de primeiro nível.

Ao usar a Tradução dinâmica, a Pesquisa com IA ignora os caches e não exibe uma resposta para o resultado de perguntas e respostas do Genius do Now Assist.
online: use os caches de primeiro e segundo níveis e Serviço Now LLM para encontrar Now Assist respostas do resultado de perguntas e respostas do Genius.

A Pesquisa com IA procurará no cache de primeiro nível as respostas do resultado das perguntas e respostas do Genius do Now Assist que correspondam exatamente à sua pesquisa e ao resultado do artigo de conhecimento. Se ela não encontrar uma resposta correspondente, usará a pesquisa vetorial semântica para procurar respostas que correspondam ao significado da sua consulta no cache de segundo nível. Se nenhuma resposta em cache corresponder à sua consulta e ao resultado do artigo de conhecimento, a Pesquisa com IA enviará a consulta e o sys_id do artigo ao Serviço Now LLM para geração de resposta.

Now Assist Respostas do resultado de perguntas e respostas do Genius geradas por Serviço Now LLM preenchem os caches de primeiro e segundo níveis.

Ao usar a Tradução dinâmica, a Pesquisa com IA ignora os caches e consulta o Serviço Now LLM para gerar uma resposta para o resultado de perguntas e respostas do Genius do Now Assist.

O modo operacional padrão é off.

Os administradores podem mudar o modo operacional dos Now Assist caches de resposta do resultado das perguntas e respostas do Genius definindo o valor da propriedade do sistema sn_ais_assist.semantic_cache_mode como off, offlineou online. Para obter detalhes sobre as configurações de propriedade do sistema, consulte Adicionar uma propriedade do sistema.

Para obter mais detalhes sobre como usar Tradução dinâmica com Now Assist Resultados do Genius, consulte Tradução dinâmica para Now Assist resultados das perguntas e respostas do Genius.

Trabalho programado para gestão de cache

O trabalho agendado Update Semantic Cache é executado diariamente para executar as seguintes tarefas:

Preencha o cache de segundo nível com resultados para as consultas enviadas com mais frequência encontradas na tabela de sinal de pesquisa de evento de pesquisa [sys_search_event]. Para obter mais informações sobre esta tabela, consulte Pesquisar tabelas de sinais.
Limpe todas as entradas de cache de segundo nível não fixadas que não foram usadas nos últimos sete dias. Os administradores de pesquisa podem fixar resultados na tabela de cache de segundo nível para impedir que sejam limpos. Para obter mais detalhes sobre este procedimento, consulte Fixar respostas em cache para Now Assist resultados de perguntas e respostas do Genius.

Fixar respostas em cache para Now Assist resultados de perguntas e respostas do Genius

Melhore o desempenho de Now Assist Resultados de perguntas e respostas do Genius fixando respostas usadas com frequência no cache de segundo nível. Fixar uma resposta a isenta do mecanismo de limpeza do cache.

Antes de Iniciar

O Now Assist na aplicação Pesquisa com IA ServiceNow® Store deve ser instalado na sua instância. Para detalhes sobre a instalação dessa aplicação, consulte Instalar Now Assist no Pesquisa com IA.

Função necessária: ais_admin

Por Que e Quando Desempenhar Esta Tarefa

Os administradores de pesquisa podem fixar entradas no cache de segundo nível para Now Assist respostas do resultado das perguntas e respostas do Genius. O trabalho agendado Update Semantic Cache ignora entradas fixadas ao limpar o cache de segundo nível.

Fixar entradas usadas com frequência ajuda a melhorar o desempenho da pesquisa, permitindo que Pesquisa com IA retorne respostas geradas anteriormente Now Assist do resultado das perguntas e respostas do Genius sem enviar artigos de conhecimento para Serviço Now LLM para geração de resposta.

Para saber mais sobre o cache de resposta de segundo nível Now Assist do resultado das perguntas e respostas do Genius e seu uso, consulte Cache para Now Assist resultados de perguntas e respostas do Genius.

Procedimento

Navegue até a exibição de lista da tabela Now Assist em Pesquisa com IA Cache semântico [sn_ais_assist_semantic_cache].
1. Selecione “Tudo”.
2. No campo Filtro, insira sn_ais_assist_semantic_cache.list.
3. Pressione Enter.
Cada registro nesta tabela representa uma entrada de cache de segundo nível. A tabela é preenchida com Now Assist respostas do resultado das perguntas e respostas do Genius geradas anteriormente pelo Serviço Now LLM.
Para cada registro de entrada de cache que você deseja fixar, execute estas etapas:
1. Abra o registro de entrada de cache selecionando-o na exibição de lista.
2. Defina o valor do campo Fixado do registro como verdadeiro.
3. Selecione Atualizar.

Resultado

O trabalho agendado Update Semantic Cache ignora suas entradas fixadas ao limpar o cache de segundo nível.