Créer un corpus de mots
Créez une collection de mots et d’expressions qui fonctionne comme le vocabulaire utilisé par le système pour comparer vos enregistrements d’instance en fonction de leur similarité textuelle. Vous pouvez considérer le corpus de mots comme un dictionnaire que vous souhaitez que votre système d’apprentissage automatique comprenne.
Avant de commencer
Pourquoi et quand exécuter cette tâche
Les informations suivantes sont fournies pour le contexte hérité.
Vous pouvez utiliser un corpus de mots pour comparer du texte d’enregistrement similaire dans une table ou dans plusieurs tables. Un corpus de mots peut également être utile dans d’autres scénarios, tels que le clustering, où vous regroupez des enregistrements similaires pour l’analyse, la réutilisation ou l’examen des données. Les éléments que vous ajoutez à votre corpus doivent être spécifiques à votre entreprise et à votre secteur d’activité afin que vous puissiez les réutiliser dans d’autres solutions de similarité ou de clustering et les appliquer à divers cas d’utilisation.
Dans cet exemple de procédure, vous travaillez sur des enregistrements d’incidents et vous souhaitez localiser les articles de base de connaissances pertinents qui pourraient fournir des solutions à ces tickets d’incident. Votre objectif ici est de créer un corpus de mots que vous pouvez appliquer à une nouvelle solution de similarité qui compare les incidents actifs aux articles publiés de la base de connaissances.