Atributos do dicionário de pesquisa e índice do Zing

  • Versão de lançamento: Xanadu
  • Atualizado 1 de ago. de 2024
  • 6 min. de leitura
  • Os seguintes atributos de dicionário afetam a maneira como o Zing indexa tabelas ou classifica os resultados da pesquisa.

    Indexar e pesquisar atributos do dicionário

    O Zing usa atributos de dicionário definidos no nível da tabela ou do campo para definir as seguintes configurações:
    • comportamento de indexação
    • classificação de resultados de pesquisa
    • o algoritmo de classificação de relevância BM25
    Tabela 1. Atributos do dicionário de pesquisa e índice do Zing
    Nome Tipo de Dados Aplica-se a Aplica-se a V3 ou V4 Descrição Rótulo Precisa de reindexação? Somente tabela raiz
    attachment_index booliano Tabela Ambos Se verdadeiro, os anexos na tabela serão indexados para fins de pesquisa. Índice de anexo VERDADEIRO FALSO
    sem_índice_de_texto booliano Ambos Ambos Este atributo em um campo evita que o campo seja incluído em um índice de texto. Nenhum índice de texto VERDADEIRO FALSO
    text_index _attachment_body _peso variável Tabela V4 Especifica o valor de consideração (peso, um valor flutuante) a ser fornecido a um termo de pesquisa encontrado no corpo de um anexo. Para obter mais informações sobre como o valor do peso afeta a relevância do resultado da pesquisa, consulte O Zing calcula as pontuações do documento usando três componentes. Peso do corpo do anexo de índice de texto FALSO VERDADEIRO
    text_index_attachment_displayed booliano Tabela Ambos Exibe anexos nos resultados da pesquisa de texto. Anexo de índice de texto exibido FALSO FALSO
    text_index_attachment _title_weight variável Tabela V4 Especifica o valor de consideração (peso, um valor flutuante) a ser fornecido a um termo de pesquisa encontrado no título de um anexo. Para obter mais informações sobre como o valor do peso afeta a relevância do resultado da pesquisa, consulte O Zing calcula as pontuações do documento usando três componentes. Peso do título do anexo do índice de texto FALSO VERDADEIRO
    text_index_auto_stop booliano Tabela Ambos Identifica automaticamente palavras irrelevantes e não as indexa. Com base no limite especificado em text_index_auto_stop_threshold. Parada automática do índice de texto VERDADEIRO VERDADEIRO
    text_index_auto _stop_threshold Número inteiro Tabela Ambos Limite (inteiro, número de ocorrências) para uma palavra se tornar uma palavra irrelevante automaticamente. Consulte text_index_auto_stop. Limite de interrupção automática do índice de texto VERDADEIRO VERDADEIRO
    text_index_default _partial_matching_rule Cadeia de caracteres Tabela Ambos Cadeia de caracteres para configuração de regra de correspondência parcial. A entrada deve ser baseada em Mude o modo de consulta de uma tabela indexada. Regra de correspondência parcial padrão de índice de texto FALSO VERDADEIRO
    text_index_default_query_mode Cadeia de caracteres Tabela Ambos Cadeia de caracteres para configuração do modo de consulta. A entrada deve ser baseada em Mudar o modo de consulta de uma tabela indexada Modo de consulta padrão de índice de texto FALSO VERDADEIRO
    text_index _disable_synonym booliano Tabela Ambos VERDADEIRO desabilita a pesquisa de sinônimos, bem como o termo de pesquisa. Desativar sinônimo de índice de texto FALSO VERDADEIRO
    text_index _enable_idf booliano Tabela V3 VERDADEIRO habilita a pontuação de TF-IDF. IDF de habilitação de índice de texto FALSO VERDADEIRO
    índice_de_texto _filtro_lixo booliano Tabela Ambos TRUE por padrão, FALSE desabilita o filtro de lixo eletrônico para uma tabela. Por padrão, o Zing não indexa ou pesquisa números de dois dígitos e palavras de um único caractere (a menos que sejam caracteres chinês ou japonês). Gere novamente o índice depois de desabilitar o filtro de lixo eletrônico. Este atributo resulta em um índice de tabela maior. Para obter o desempenho ideal, não o aplique a menos que seja necessário. Lixo eletrônico do filtro de índice de texto VERDADEIRO VERDADEIRO
    text_index_filter_query Um encodedQuery na tabela Tabela Ambos Use este atributo quando quiser indexar as linhas que correspondem a condições de filtro específicas. O valor do atributo deve ser um encodedQuery na tabela. Filtro de índice VERDADEIRO FALSO
    text_index_filterable booliano Coluna Ambos Se um campo com este atributo definido como verdadeiro for alterado, a linha será avaliada para reindexação (mesmo que o campo em si não seja indexável). Índice filtrável VERDADEIRO FALSO
    text_index_include _stop_word booliano Tabela Ambos se você precisar indexar palavras irrelevantes nesta tabela, defina este atributo como verdadeiro. Palavra irrelevante de inclusão de índice de texto VERDADEIRO VERDADEIRO
    text_index_scorer_bm25_b variável Tabela V4 Este atributo é o parâmetro b usado no algoritmo BM25. Consulte text_index_scorer_bm25_b. bm25_b FALSO VERDADEIRO
    text_index_scorer_bm25_k1 variável Tabela V4 Este atributo é o parâmetro K1 usado no algoritmo BM25. Consulte text_index_scorer_bm25_k1. bm25_k1 FALSO VERDADEIRO
    text_index_tags Cadeia de caracteres Tabela Ambos Deve ser definido como cadeia de caracteres específica: empty/everyone_only/all_shared, dependendo do tipo de marcadores que deseja ser indexado. Marcadores de índice de texto VERDADEIRO FALSO
    texto_index_tokenizer _idioma Cadeia de caracteres Tabela Ambos Coloque "ja" (sem aspas duplas) quando houver necessidade de oferecer suporte à tokenização em japonês. Idioma do tokenizador de índice de texto VERDADEIRO VERDADEIRO
    text_index_translations booliano Tabela Ambos Se presente ou verdadeiro, força os índices a serem recalculados quando cadeias de caracteres traduzidas são adicionadas. Requer a função sys-admin para modificar. Definido automaticamente para campos indexados que são traduzidos e para campos que têm uma tradução e estão sendo indexados. A propriedade do sistema glide.i18n.force_index, cujo padrão é verdadeiro, substitui este atributo. Traduções de índice de texto VERDADEIRO FALSO
    text_search_and_or_limit Número inteiro Tabela Ambos Adicione o atributo personalizado de nível de tabela text_search_and_or_limit que substitui a propriedade global. Limite de Pesquisa de Texto E OU FALSO FALSO
    ts_language Cadeia de caracteres Coluna Ambos Adicionado para permitir a indexação de texto somente de idiomas específicos. Idioma da pesquisa de texto VERDADEIRO FALSO
    ts_multi_value_field _splitter Cadeia de caracteres Coluna Ambos Se um campo for um campo de vários valores, adicione o divisor no campo neste atributo para distribuir as posições de índice dos valores. Por exemplo, para separar multi:value, coloque : para este atributo. Divisor de campo de vários valores de pesquisa de texto VERDADEIRO VERDADEIRO
    peso_ts Número inteiro Coluna Ambos Controla a importância relativa de uma correspondência no campo para pesquisa de texto. Para obter mais informações sobre como o valor do peso afeta a relevância do resultado da pesquisa, consulte O Zing calcula as pontuações do documento usando três componentes. Para saber como definir o peso da pesquisa de texto para um campo, consulte Definir o peso relativo de um campo. Peso da pesquisa de texto FALSO FALSO

    sem_índice_de_texto

    Para obter as diretrizes Suporte e atendimento ao cliente sobre como definir a opção no_text_index para diferentes tipos de campo, consulte KB0859922 no site Now Support.

    text_index_scorer_bm25_b

    Este atributo de dicionário faz parte do algoritmo BM25. O atributo afeta a importância do tamanho de um documento nos resultados da pesquisa. Se este atributo for 0, o comprimento não terá relação. Nesse caso, um documento de duas palavras seria avaliado igualmente como um documento com 1000 palavras. Documentos muito curtos geralmente têm peso inferior a documentos mais longos. O padrão é 0,75.

    text_index_scorer_bm25_k1

    Este atributo de dicionário faz parte do algoritmo BM25. O atributo ajuda a determinar as características de saturação da frequência do termo, ou seja, fazer com que o termo de pesquisa apareça em um documento aumenta a relevância do documento, mas o aumento é menos impactante conforme os números sobem. Por exemplo, um termo de pesquisa que ocorre 10 vezes em um documento o torna mais relevante do que um documento que tem apenas uma ocorrência. No entanto, um documento com 100 ocorrências do termo de pesquisa pode não ser dez vezes mais impactante do que um documento com 10 ocorrências. A relevância se aproxima de uma assíntota de efeito máximo. Quanto maior o valor do atributo, menor será o efeito máximo de várias ocorrências. Os valores típicos estão entre 1,25 e 2,0.