Índice do Zing e atributos do dicionário de pesquisa
Os atributos de dicionário a seguir afetam a maneira como o Zing indexa tabelas ou classifica os resultados da pesquisa.
Atributos de índice e dicionário de pesquisa
- comportamento de indexação
- classificação dos resultados da pesquisa
- o algoritmo de classificação de relevância BM25
| Nome | Tipo de Dados | Aplica-se a | Aplica-se a V3 ou V4 | Descrição | Rótulo | Precisa de reindexação? | Somente tabela raiz |
|---|---|---|---|---|---|---|---|
| attachment_index | booliano | Tabela | Ambos | Se verdadeiro, os anexos na tabela serão indexados para fins de pesquisa. | Índice de Anexo | VERDADEIRO | FALSO |
| sem_texto_índice | booliano | Ambos | Ambos | Este atributo em um campo evita que o campo seja incluído em um índice de texto. | Nenhum índice de texto | VERDADEIRO | FALSO |
| text_index _attachment_body _weight | variável | Tabela | V4 | Especifica a quantidade de consideração (peso, um valor flutuante) a ser fornecida a um termo de pesquisa encontrado no corpo de um anexo. Para obter mais informações sobre como o valor do peso afeta a relevância do resultado da pesquisa, consulte O Zing calcula pontuações de documento usando três componentes. | Peso do corpo do anexo de índice de texto | FALSO | VERDADEIRO |
| índice_texto _attachment_displayed | booliano | Tabela | Ambos | Exibe anexos nos resultados da pesquisa de texto. | Anexo de índice de texto exibido | FALSO | FALSO |
| text_index_attachment _title_weight | variável | Tabela | V4 | Especifica a quantidade de consideração (peso, um valor flutuante) a ser fornecida a um termo de pesquisa encontrado no título de um anexo. Para obter mais informações sobre como o valor do peso afeta a relevância do resultado da pesquisa, consulte O Zing calcula pontuações de documento usando três componentes. | Peso do título do anexo de índice de texto | FALSO | VERDADEIRO |
| text_index _auto_stop | booliano | Tabela | Ambos | Identifica automaticamente palavras irrelevantes e não as indexa. Com base no limite especificado em text_index_auto_stop_threshold. | Parada automática do índice de texto | VERDADEIRO | VERDADEIRO |
| text_index_auto _stop_threshold | int | Tabela | Ambos | Limite (inteiro, número de ocorrências) para que uma palavra se torne uma palavra irrelevante automaticamente. Consulte text_index_auto_stop. | Limite de parada automática do índice de texto | VERDADEIRO | VERDADEIRO |
| text_index_default _parcial_matching_rule | Cadeia de caracteres | Tabela | Ambos | Cadeia de caracteres para configuração de regra de correspondência parcial. A entrada deve ser baseada em Mudar o modo de consulta de uma tabela indexada. | Regra de correspondência parcial padrão de índice de texto | FALSO | VERDADEIRO |
| índice_texto _default_query_mode | Cadeia de caracteres | Tabela | Ambos | Cadeia de caracteres para configuração do modo de consulta. A entrada deve ser baseada em Mudar o modo de consulta de uma tabela indexada | Modo de consulta padrão do índice de texto | FALSO | VERDADEIRO |
| text_index _disable_synonym | booliano | Tabela | Ambos | TRUE desabilita a pesquisa de sinônimos, bem como do termo de pesquisa. | Desativar Sinônimo de Índice de Texto | FALSO | VERDADEIRO |
| text_index _enable_idf | booliano | Tabela | V3 | TRUE habilita a pontuação de TF-IDF. | IDF de habilitação de índice de texto | FALSO | VERDADEIRO |
| text_index _filter_junk | booliano | Tabela | Ambos | TRUE por padrão, FALSE desabilita o filtro de lixo eletrônico de uma tabela. Por padrão, o Zing não indexa ou pesquisa números de dois dígitos e palavras de caractere único (a menos que sejam caracteres chinês ou japonês). Gera novamente o índice após desabilitar o filtro de lixo eletrônico. Este atributo resulta em um índice de tabela maior. Para obter o desempenho ideal, não o aplique a menos que seja necessário. | Lixeira de Filtro de Índice de Texto | VERDADEIRO | VERDADEIRO |
| text_index _filter_query | Um encodedQuery na tabela | Tabela | Ambos | Use este atributo quando quiser indexar as linhas que correspondem a condições de filtro específicas. O valor do atributo deve ser um encodedQuery na tabela. | Filtro de índice | VERDADEIRO | FALSO |
| texto_índice_filtrável | booliano | Coluna | Ambos | Se um campo com este atributo definido como verdadeiro for alterado, a linha será avaliada para reindexação (mesmo que o campo em si não seja indexável). | Índice filtrável | VERDADEIRO | FALSO |
| text_index_include _stop_word | booliano | Tabela | Ambos | se você precisar indexar palavras irrelevantes nesta tabela, defina este atributo como verdadeiro. | Índice de texto inclui palavra irrelevante | VERDADEIRO | VERDADEIRO |
| text_index_scorer_bm25_b | variável | Tabela | V4 | Este atributo é o parâmetro b usado no algoritmo BM25. Consulte text_index_scorer_bm25_b. | bm25_b | FALSO | VERDADEIRO |
| text_index_scorer_bm25_k1 | variável | Tabela | V4 | Este atributo é o parâmetro K1 usado no algoritmo BM25. Consulte text_index_scorer_bm25_k1. | bm25_k1 | FALSO | VERDADEIRO |
| text_index_tags | Cadeia de caracteres | Tabela | Ambos | Deve ser definido como Cadeia de caracteres específica: empty/everyone_only/all_shared, dependendo do tipo de marcadores que deseja ser indexado. | Marcadores de índice de texto | VERDADEIRO | FALSO |
| texto_index_tokenizer _idioma | Cadeia de caracteres | Tabela | Ambos | Coloque "ja" (sem aspas duplas) quando houver necessidade de oferecer suporte à tokenização em japonês. | Linguagem do tokenizador de índice de texto | VERDADEIRO | VERDADEIRO |
| text_index_translations | booliano | Tabela | Ambos | Se presente ou verdadeiro, força os índices a serem recalculados quando as cadeias de caracteres traduzidas são adicionadas. Requer a função sys-admin para modificar. Definido automaticamente para campos indexados que são traduzidos e para campos que têm uma tradução e estão sendo indexados. A propriedade do sistema glide.i18n.force_index, cujo padrão é verdadeiro, substitui este atributo. | Traduções de índice de texto | VERDADEIRO | FALSO |
| text_search_and_or_limit | int | Tabela | Ambos | Adicione o atributo personalizado de nível de tabela text_search_and_or_limit que substitui a propriedade global. | Limite de pesquisa de texto e ou | FALSO | FALSO |
| ts_language | Cadeia de caracteres | Coluna | Ambos | Adicionado para permitir a indexação de texto somente de idiomas específicos. | Idioma de pesquisa de texto | VERDADEIRO | FALSO |
| ts_multi_value_field _splitter | Cadeia de caracteres | Coluna | Ambos | Se um campo for um campo de vários valores, adicione o divisor no campo neste atributo para distribuir as posições de índice dos valores. Por exemplo, para separar multi:value, coloque : para este atributo. | Divisor de campo de vários valores de Pesquisa de texto | VERDADEIRO | VERDADEIRO |
| ts_weight | int | Coluna | Ambos | Controla a importância relativa de uma correspondência no campo para pesquisa de texto. Para obter mais informações sobre como o valor do peso afeta a relevância do resultado da pesquisa, consulte O Zing calcula pontuações de documento usando três componentes. Para saber como definir o peso da pesquisa de texto para um campo, consulte Definir o peso relativo de um campo. | Peso da pesquisa de texto | FALSO | FALSO |
sem_texto_índice
Para obter diretrizes de Suporte e atendimento ao cliente sobre como definir a opção no_text_index para diferentes tipos de campo, consulte KB0859922 no site Now Support.
text_index_scorer_bm25_b
Este atributo de dicionário faz parte do algoritmo BM25. O atributo afeta a importância do tamanho de um documento nos resultados da pesquisa. Se este atributo for 0, o comprimento não terá relação. Nesse caso, um documento de duas palavras seria avaliado igualmente como um documento com 1000 palavras. Documentos muito curtos geralmente têm peso inferior a documentos mais longos. O padrão é 0,75.
text_index_scorer_bm25_k1
Este atributo de dicionário faz parte do algoritmo BM25. O atributo ajuda a determinar as características de saturação de frequência do termo, ou seja, ter o termo de pesquisa exibido em um documento aumenta a relevância do documento, mas o aumento é menos impactante conforme os números sobem. Por exemplo, um termo de pesquisa que ocorre 10 vezes em um documento o torna mais relevante do que um documento que tem apenas uma ocorrência. No entanto, um documento com 100 ocorrências do termo de pesquisa pode não ser dez vezes mais impactante do que um documento com 10 ocorrências. A relevância se aproxima de uma assíntota de efeito máximo. Quanto maior o valor do atributo, menor o efeito máximo de várias ocorrências. Os valores típicos estão entre 1,25 e 2,0.