Créer un corpus de mots
Créez une collection de mots et d’expressions qui fonctionne comme le vocabulaire utilisé par le système pour comparer vos enregistrements d’instance en fonction de leur similarité textuelle. Vous pouvez considérer le corpus de mots comme un dictionnaire que vous voulez que votre système d’apprentissage automatique comprenne.
Avant de commencer
Pourquoi et quand exécuter cette tâche
Les informations suivantes sont fournies pour le contexte d’héritage.
Vous pouvez utiliser un corpus de mots pour comparer un texte d’enregistrement similaire dans une table ou dans plusieurs tables. Un corpus de mots peut également être utile dans d’autres scénarios, tels que la mise en grappe, où vous regroupez des enregistrements similaires pour l’analyse, la réutilisation ou la révision des données. Les éléments que vous ajoutez à votre corpus doivent être spécifiques à votre entreprise et à votre secteur d’activité afin que vous puissiez les réutiliser dans d’autres solutions de similarité ou de clustering et les appliquer à divers cas d’utilisation.
Dans cet exemple de procédure, vous travaillez sur des enregistrements d’incidents et vous souhaitez localiser les articles de la base de connaissances pertinents qui pourraient fournir des solutions à ces tickets d’incident. Votre objectif ici est de créer un corpus de mots que vous pouvez appliquer à une nouvelle solution de similarité qui compare les incidents actifs aux articles de la base de connaissances publiés.