Configurer TF-IDF pour les solutions
Appliquez le codage TF-IDF (Term Frequency–Inverse Document Frequency) aux solutions de classification, de similarité, de régression ou de regroupement.
Avant de commencer
Remarque :
La configuration des paramètres avancés sur vos solutions ML est facultative. Si vous choisissez de configurer l’un de ces paramètres, assurez-vous d’être bien informé concernant la technologie que vous activez dans la solution et que vous disposez d’un cas d’utilisation qui bénéficie de ce que la technologie offre.
- Créez une définition de solution de similarité ou utilisez une définition existante.
- Créez une définition de solution de classification ou utilisez une définition de solution existante.
- Créez une définition de solution de régression ou utilisez une définition existante.
- Si vous disposez d’un abonnement Professional et que vous implémentez Intelligence prédictive pour la première fois dans Vancouver, créez une définition de solution de clustering ou utilisez une définition existante.
- Rôle requis : admin ou ml_admin
Pourquoi et quand exécuter cette tâche
Predictive Intelligence utilise l’incorporation de mots vectoriels de paragraphe par défaut dans ses cadres de travail de classification, de similarité et de régression, ce qui est très efficace pour traiter des données composées principalement de contenu lisible par l’homme. Cependant, TF-IDF est connu pour renvoyer parfois de meilleurs résultats de prédiction pour les enregistrements qui ont du contenu généré par machine, tels que des alertes et des messages d’erreur pour les fichiers journaux. Vous avez donc le choix en fonction du type de données que votre solution traite.
Remarque :
Les étapes de configuration de TF-IDF sont les mêmes pour tous les frameworks de modèle, mais la prise en charge de l’IF-IDF pour les définitions de solutions de clustering n’est applicable que si vous disposez d’un abonnement Professional et que vous implémentez Intelligence prédictive pour la première fois à Vancouverpartir de .