Indexation du contenu à partir des sources indexées

  • Rversion finale: Xanadu
  • Mis à jour 1 août 2024
  • 5 minutes de lecture
  • Recherche IA indexe les enregistrements sur les tables sources indexées pour rendre leur contenu consultable.

    Une fois que vous avez défini une source indexée, Recherche IA l’indexation commence automatiquement pour refléter les changements apportés aux enregistrements dans la table source sélectionnée et ses tables enfants spécifiées. Les résultats de toutes les opérations de création, de mise à jour et de suppression d’enregistrements dans ces tables sont reflétés dans l’index de recherche. Recherche IA n’indexe pas le contenu des enregistrements non modifiés de ces tables tant que vous n’avez pas effectué un index de table complet.

    Indexation du contenu à partir des tables référencées

    Lorsqu’une table source indexée inclut un champ de référence qui stocke une référence à une autre table, les valeurs d’indexation du champ de référence sont utilisées par défaut, Recherche IA mais pas pour les autres champs de la table référencée. Par exemple, la table Utilisateur [sys_user] inclut un champ de référence de société qui stocke une référence à la table Société [core_company]. Lors de l’indexation des enregistrements à partir de la table Utilisateur, Recherche IA indexe les valeurs pour le champ de référence de société , mais n’indexe pas les valeurs pour les autres champs de la table de société tels que la ville ou le site Web.

    Pour indexer des champs supplémentaires à partir de tables référencées, vous pouvez configurer dot_walk_fields les paramètres de searchable_dot_walk_fields champ des champs de référence de votre table source indexée.
    • Pour utiliser des valeurs de champ issues de tables référencées dans des filtres de source de recherche, des filtres de facette et EVAM des configurations de résultats de recherche, créez un dot_walk_fields paramètre de champ.
    • Pour permettre la recherche des valeurs de champ des tables référencées, créez un searchable_dot_walk_fields paramètre de champ.

    Vous pouvez créer des dot_walk_fields paramètres de champ et searchable_dot_walk_fields pour le même champ de référence.

    Pour obtenir des instructions sur la configuration dot_walk_fields et searchable_dot_walk_fields les paramètres des champs, reportez-vous à la section Activer l’indexation des champs de table référencés pour une source indexée. Pour en savoir plus sur les paramètres des champs, reportez-vous à la section Paramétrage du champ. Pour en savoir plus sur les filtres de sources de recherche, reportez-vous à la section Rechercher des sources. Pour en savoir plus sur les filtres de facette, reportez-vous à la section Créer une facette dans la configuration d’une Recherche IA application. Pour comprendre EVAM les configurations, consultez Mappage d'action des vues d'entité.

    Indexation du contenu à partir des pièces jointes de l’enregistrement source

    Par défaut, Recherche IA indexe le contenu interrogeable et les métadonnées (telles que la taille du fichier et la date) pour les pièces jointes trouvées sur les enregistrements de la table source. L’indexation prend en charge les formats de fichier de pièce jointe suivants :
    • Page du serveur active étendue (.aspx)
    • Langage de balisage hypertexte (.html, .htm)
    • Microsoft Excel (.xls, .xlsx)
    • Microsoft PowerPoint (.pot, .potx, .ppt, .pptm, .pptx)
    • Microsoft Mot (.doc, .docx, .dot, .dotx)
    • Texte brut (.txt)
    • Format de document portable (.pdf)
    Remarque :
    Recherche IA ignore les pièces jointes d’une taille supérieure à 25 Mo. L’indexation standard indexe uniquement le contenu de la première tranche Mo de données de la pièce jointe, tandis que l’indexation vectorielle sémantique indexe le contenu complet de la pièce jointe.
    Recherche IA Fournit une prise en charge limitée des pièces jointes d’enregistrements chiffrés :
    • Lors de l’indexation d’une pièce jointe chiffrée, Recherche IA extrait les métadonnées telles que la taille du fichier et la date, mais n’extrait pas de contenu consultable.
    • Le type MIME de la pièce jointe chiffrée est détecté comme application/octet-stream.
    • Aucun commentaire pour la pièce jointe chiffrée n’apparaît dans les messages du journal d’ingestion.

    L’indexation des pièces jointes est contrôlée par l’attribut d’une index_attachments source indexée. Pour vérifier que l’indexation des pièces jointes est activée pour une source indexée, reportez-vous à la section Activer l’indexation des pièces jointes pour une source indexée.

    Indexation du contenu à partir des balises d’enregistrement source

    Recherche IA Peut indexer les balises trouvées sur les enregistrements de la table source. Les résultats de recherche affichent des balises indexées en fonction de la visibilité de l’enregistrement de résultat et non de celle de la balise.

    Par défaut, l’indexation ignore les balises des enregistrements sources. Vous pouvez activer l’indexation des balises pour chaque source indexée. Choisissez si vous souhaitez indexer toutes les balises partagées et globalement visibles ou uniquement les balises globalement visibles.

    Pour plus d’informations sur l’activation de l’indexation des balises pour une source indexée, reportez-vous à la section Activer l’indexation des balises pour une source indexée.

    Indexation du contenu à partir de la table Tâche et de ses tables enfants

    Lors de la définition d’une source indexée qui indexe les enregistrements de la table de tâches ou de l’une de ses tables enfants, vous devez spécifier une politique de conservation. Pour en savoir plus sur les stratégies de conservation, reportez-vous à la section Politiques de rétention des sources indexées et conditions de filtre.

    Indexation du contenu à partir d’articles de la base de connaissances

    Recherche IA ne prend pas en charge l’indexation et la recherche de contenu dans les blocs de connaissances inclus dans les articles de la base de connaissances.

    Lors de l’indexation d’un enregistrement d’article de la base de connaissances qui contient des blocs de connaissances, Recherche IA ignore le contenu du bloc de connaissances et indexe uniquement le contenu textuel littéral de l’enregistrement. Cela peut inclure les ID ou les noms d’affichage des blocs de connaissances inclus dans l’article.

    Réindexation du contenu

    Vous devez procéder à une réindexation complète de la table pour une source indexée dans les circonstances suivantes :
    • Après avoir ajouté, modifié ou supprimé un attribut de source indexée ou un paramètre de champ pour la source indexée.
    • Si vous souhaitez mettre à jour les valeurs indexées pour les champs sur les tables référencées par les enregistrements de la table source. À titre d’exemple, le champ Société de la table Utilisateur [sys_user] stocke une référence à la table Société [core_company]. Si vous configurez l’indexation des valeurs des champs de la table Entreprise référencée, tels que Ville ou Site Web, vous devez réindexer la table Utilisateur pour mettre à jour ces valeurs de champ Table Entreprise indexée. Pour plus d’informations sur la configuration de l’indexation des champs de table référencés, reportez-vous à la section Activer l’indexation des champs de table référencés pour une source indexée.