Configurer TF-IDF pour les solutions

  • Rversion finale: Washingtondc
  • Mis à jour 1 févr. 2024
  • 2 minutes de lecture
  • Appliquez le codage TF-IDF (Term Frequency–Inverse Document Frequency) aux solutions de classification, de similarité, de régression ou de regroupement.

    Avant de commencer

    Rôle requis : admin ou ml_admin
    Remarque :
    La configuration des paramètres avancés sur vos solutions ML est facultative. Si vous choisissez de configurer l’un de ces paramètres, assurez-vous d’être bien informé concernant la technologie que vous activez dans la solution et que vous disposez d’un cas d’utilisation qui bénéficie de ce que la technologie offre.
    • Créez une définition de solution de similarité ou utilisez une définition existante.
    • Créez une définition de solution de classification ou utilisez une définition de solution existante.
    • Créez une définition de solution de régression ou utilisez une définition existante.
    • Si vous disposez d’un abonnement Professional et que vous implémentez Intelligence prédictive pour la première fois dans Vancouver, créez une définition de solution de clustering ou utilisez une définition existante.
    • Rôle requis : admin ou ml_admin

    Pourquoi et quand exécuter cette tâche

    Predictive Intelligence utilise l’incorporation de mots vectoriels de paragraphe par défaut dans ses cadres de travail de classification, de similarité et de régression, ce qui est très efficace pour traiter des données composées principalement de contenu lisible par l’homme. Cependant, TF-IDF est connu pour renvoyer parfois de meilleurs résultats de prédiction pour les enregistrements qui ont du contenu généré par machine, tels que des alertes et des messages d’erreur pour les fichiers journaux. Vous avez donc le choix en fonction du type de données que votre solution traite.

    Remarque :
    Les étapes de configuration de TF-IDF sont les mêmes pour tous les frameworks de modèle, mais la prise en charge de l’IF-IDF pour les définitions de solutions de clustering n’est applicable que si vous disposez d’un abonnement Professional et que vous implémentez Intelligence prédictive pour la première fois à Vancouverpartir de .

    Procédure

    1. Accédez à une définition de solution, telle que Tous > Intelligence prédictive > Similarité > Définitions des solutions.
    2. Ouvrez un formulaire de définition de solution.
      Dans cet exemple de scénario, vous utilisez un formulaire de définition de similarité CMBD.
      Exemple de définition de solution de similarité à laquelle vous appliquez le paramètre TF-IDF.
    3. Dans l’onglet Paramètres de solution avancée de la section Liens connexes du formulaire, cliquez sur Nouveau.
      Comment sélectionner l’option Paramètres de solution pour créer le paramètre.
    4. Créez un enregistrement de paramètre.
      1. Dans le champ Paramètres de la solution , cliquez sur l’icône de recherche.
      2. Dans l’écran Paramètres de solution ML, sélectionnez Utiliser tf-idf pour générer des vecteurs.
      Pour créer l’enregistrement de paramètre, sélectionnez le bouton Rechercher, puis la clé TF-IDF Brève description.
    5. Cliquez sur Envoyer.

      L’écran d’enregistrement Paramètres de solution avancée s’actualise.

      Consultez le nouvel enregistrement de paramètre de solution avancée que vous avez créé.
    6. Cliquez sur Envoyer.

      Résultat: TF-IDF est configuré pour votre solution de similarité. Son paramètre de solution s’affiche dans l’onglet Paramètres de solution avancés de votre formulaire de définition de similarité.

      Cette image montre l’enregistrement de paramètre de solution avancée pour TF-IDF.