Atributos do dicionário de pesquisa e índice do Zing

Administração do Now Platform no Xanadu

Release

xanadu

ft:locale

pt-BR

ft:publication_title

Administração do Now Platform no Xanadu

ft:clusterId

platadm

bundleId

platadm

workflow

Platform

Atributos do dicionário de pesquisa e índice do Zing

Versão de lançamento: Xanadu

Atualizado 1 de ago. de 2024

6 min. de leitura

Os seguintes atributos de dicionário afetam a maneira como o Zing indexa tabelas ou classifica os resultados da pesquisa.

Indexar e pesquisar atributos do dicionário

O Zing usa atributos de dicionário definidos no nível da tabela ou do campo para definir as seguintes configurações:

comportamento de indexação
classificação de resultados de pesquisa
o algoritmo de classificação de relevância BM25

Tabela 1. Atributos do dicionário de pesquisa e índice do Zing
Nome	Tipo de Dados	Aplica-se a	Aplica-se a V3 ou V4	Descrição	Rótulo	Precisa de reindexação?	Somente tabela raiz
attachment_index	booliano	Tabela	Ambos	Se verdadeiro, os anexos na tabela serão indexados para fins de pesquisa.	Índice de anexo	VERDADEIRO	FALSO
sem_índice_de_texto	booliano	Ambos	Ambos	Este atributo em um campo evita que o campo seja incluído em um índice de texto.	Nenhum índice de texto	VERDADEIRO	FALSO
text_index _attachment_body _peso	variável	Tabela	V4	Especifica o valor de consideração (peso, um valor flutuante) a ser fornecido a um termo de pesquisa encontrado no corpo de um anexo. Para obter mais informações sobre como o valor do peso afeta a relevância do resultado da pesquisa, consulte O Zing calcula as pontuações do documento usando três componentes.	Peso do corpo do anexo de índice de texto	FALSO	VERDADEIRO
text_index_attachment_displayed	booliano	Tabela	Ambos	Exibe anexos nos resultados da pesquisa de texto.	Anexo de índice de texto exibido	FALSO	FALSO
text_index_attachment _title_weight	variável	Tabela	V4	Especifica o valor de consideração (peso, um valor flutuante) a ser fornecido a um termo de pesquisa encontrado no título de um anexo. Para obter mais informações sobre como o valor do peso afeta a relevância do resultado da pesquisa, consulte O Zing calcula as pontuações do documento usando três componentes.	Peso do título do anexo do índice de texto	FALSO	VERDADEIRO
text_index_auto_stop	booliano	Tabela	Ambos	Identifica automaticamente palavras irrelevantes e não as indexa. Com base no limite especificado em text_index_auto_stop_threshold.	Parada automática do índice de texto	VERDADEIRO	VERDADEIRO
text_index_auto _stop_threshold	Número inteiro	Tabela	Ambos	Limite (inteiro, número de ocorrências) para uma palavra se tornar uma palavra irrelevante automaticamente. Consulte text_index_auto_stop.	Limite de interrupção automática do índice de texto	VERDADEIRO	VERDADEIRO
text_index_default _partial_matching_rule	Cadeia de caracteres	Tabela	Ambos	Cadeia de caracteres para configuração de regra de correspondência parcial. A entrada deve ser baseada em Mude o modo de consulta de uma tabela indexada.	Regra de correspondência parcial padrão de índice de texto	FALSO	VERDADEIRO
text_index_default_query_mode	Cadeia de caracteres	Tabela	Ambos	Cadeia de caracteres para configuração do modo de consulta. A entrada deve ser baseada em Mudar o modo de consulta de uma tabela indexada	Modo de consulta padrão de índice de texto	FALSO	VERDADEIRO
text_index _disable_synonym	booliano	Tabela	Ambos	VERDADEIRO desabilita a pesquisa de sinônimos, bem como o termo de pesquisa.	Desativar sinônimo de índice de texto	FALSO	VERDADEIRO
text_index _enable_idf	booliano	Tabela	V3	VERDADEIRO habilita a pontuação de TF-IDF.	IDF de habilitação de índice de texto	FALSO	VERDADEIRO
índice_de_texto _filtro_lixo	booliano	Tabela	Ambos	TRUE por padrão, FALSE desabilita o filtro de lixo eletrônico para uma tabela. Por padrão, o Zing não indexa ou pesquisa números de dois dígitos e palavras de um único caractere (a menos que sejam caracteres chinês ou japonês). Gere novamente o índice depois de desabilitar o filtro de lixo eletrônico. Este atributo resulta em um índice de tabela maior. Para obter o desempenho ideal, não o aplique a menos que seja necessário.	Lixo eletrônico do filtro de índice de texto	VERDADEIRO	VERDADEIRO
text_index_filter_query	Um encodedQuery na tabela	Tabela	Ambos	Use este atributo quando quiser indexar as linhas que correspondem a condições de filtro específicas. O valor do atributo deve ser um encodedQuery na tabela.	Filtro de índice	VERDADEIRO	FALSO
text_index_filterable	booliano	Coluna	Ambos	Se um campo com este atributo definido como verdadeiro for alterado, a linha será avaliada para reindexação (mesmo que o campo em si não seja indexável).	Índice filtrável	VERDADEIRO	FALSO
text_index_include _stop_word	booliano	Tabela	Ambos	se você precisar indexar palavras irrelevantes nesta tabela, defina este atributo como verdadeiro.	Palavra irrelevante de inclusão de índice de texto	VERDADEIRO	VERDADEIRO
text_index_scorer_bm25_b	variável	Tabela	V4	Este atributo é o parâmetro b usado no algoritmo BM25. Consulte text_index_scorer_bm25_b.	bm25_b	FALSO	VERDADEIRO
text_index_scorer_bm25_k1	variável	Tabela	V4	Este atributo é o parâmetro K1 usado no algoritmo BM25. Consulte text_index_scorer_bm25_k1.	bm25_k1	FALSO	VERDADEIRO
text_index_tags	Cadeia de caracteres	Tabela	Ambos	Deve ser definido como cadeia de caracteres específica: empty/everyone_only/all_shared, dependendo do tipo de marcadores que deseja ser indexado.	Marcadores de índice de texto	VERDADEIRO	FALSO
texto_index_tokenizer _idioma	Cadeia de caracteres	Tabela	Ambos	Coloque "ja" (sem aspas duplas) quando houver necessidade de oferecer suporte à tokenização em japonês.	Idioma do tokenizador de índice de texto	VERDADEIRO	VERDADEIRO
text_index_translations	booliano	Tabela	Ambos	Se presente ou verdadeiro, força os índices a serem recalculados quando cadeias de caracteres traduzidas são adicionadas. Requer a função sys-admin para modificar. Definido automaticamente para campos indexados que são traduzidos e para campos que têm uma tradução e estão sendo indexados. A propriedade do sistema glide.i18n.force_index, cujo padrão é verdadeiro, substitui este atributo.	Traduções de índice de texto	VERDADEIRO	FALSO
text_search_and_or_limit	Número inteiro	Tabela	Ambos	Adicione o atributo personalizado de nível de tabela text_search_and_or_limit que substitui a propriedade global.	Limite de Pesquisa de Texto E OU	FALSO	FALSO
ts_language	Cadeia de caracteres	Coluna	Ambos	Adicionado para permitir a indexação de texto somente de idiomas específicos.	Idioma da pesquisa de texto	VERDADEIRO	FALSO
ts_multi_value_field _splitter	Cadeia de caracteres	Coluna	Ambos	Se um campo for um campo de vários valores, adicione o divisor no campo neste atributo para distribuir as posições de índice dos valores. Por exemplo, para separar multi:value, coloque : para este atributo.	Divisor de campo de vários valores de pesquisa de texto	VERDADEIRO	VERDADEIRO
peso_ts	Número inteiro	Coluna	Ambos	Controla a importância relativa de uma correspondência no campo para pesquisa de texto. Para obter mais informações sobre como o valor do peso afeta a relevância do resultado da pesquisa, consulte O Zing calcula as pontuações do documento usando três componentes. Para saber como definir o peso da pesquisa de texto para um campo, consulte Definir o peso relativo de um campo.	Peso da pesquisa de texto	FALSO	FALSO

sem_índice_de_texto

Para obter as diretrizes Suporte e atendimento ao cliente sobre como definir a opção no_text_index para diferentes tipos de campo, consulte KB0859922 no site Now Support.

text_index_scorer_bm25_b

Este atributo de dicionário faz parte do algoritmo BM25. O atributo afeta a importância do tamanho de um documento nos resultados da pesquisa. Se este atributo for 0, o comprimento não terá relação. Nesse caso, um documento de duas palavras seria avaliado igualmente como um documento com 1000 palavras. Documentos muito curtos geralmente têm peso inferior a documentos mais longos. O padrão é 0,75.

text_index_scorer_bm25_k1

Este atributo de dicionário faz parte do algoritmo BM25. O atributo ajuda a determinar as características de saturação da frequência do termo, ou seja, fazer com que o termo de pesquisa apareça em um documento aumenta a relevância do documento, mas o aumento é menos impactante conforme os números sobem. Por exemplo, um termo de pesquisa que ocorre 10 vezes em um documento o torna mais relevante do que um documento que tem apenas uma ocorrência. No entanto, um documento com 100 ocorrências do termo de pesquisa pode não ser dez vezes mais impactante do que um documento com 10 ocorrências. A relevância se aproxima de uma assíntota de efeito máximo. Quanto maior o valor do atributo, menor será o efeito máximo de várias ocorrências. Os valores típicos estão entre 1,25 e 2,0.