Créer un corpus de mots
Créez une collection de mots et d’expressions qui fonctionne comme le vocabulaire utilisé par le système pour comparer vos enregistrements d’instance en fonction de leur similarité textuelle. Vous pouvez considérer le corpus de mots comme un dictionnaire que vous voulez que votre système d’apprentissage automatique comprenne.
Avant de commencer
Après la mise à niveau, vos solutions existantes avec un corpus de mots deviennent des solutions de workflow la prochaine fois qu’elles sont reformées. En outre, le champ Corpus de mots est supprimé du formulaire.
Les informations suivantes sont fournies pour le contexte hérité.
Pourquoi et quand exécuter cette tâche
L’objectif principal d’un corpus de mots est de déduire des données textuelles pour l’entraînement de votre NLU modèle. Si vous utilisez un corpus de mots dans une solution, vous devez le spécifier pour la formation dans la phase de définition de solution d’une solution. Un corpus de mots formé peut être réutilisé entre les solutions et les fonctionnalités.
Vous pouvez utiliser un corpus de mots pour vous aider à comparer du texte d’enregistrement similaire dans une table ou dans plusieurs tables. Un corpus de mots peut également être utile dans d’autres scénarios, tels que le regroupement, où vous regroupez des enregistrements similaires pour l’analyse, la réutilisation ou l’examen des données. Les éléments que vous ajoutez à votre corpus doivent être spécifiques à votre entreprise et à votre secteur afin que vous puissiez les réutiliser dans d’autres solutions de similarité ou de clustering et les appliquer à divers cas d’utilisation.
Dans cet exemple de procédure, vous travaillez sur des enregistrements d’incidents et vous souhaitez localiser les articles de la base de connaissances (KB) pertinents qui pourraient fournir des résolutions à ces tickets d’incident. Votre objectif ici est de créer un corpus de mots que vous pouvez appliquer à une nouvelle solution de similarité qui compare les incidents actifs aux articles publiés de la base de connaissances.