Konfigurieren Sie TF-IDF für -Lösungen

  • Freigeben Version: Washingtondc
  • Aktualisiert 1. Februar 2024
  • 1 Minute Lesedauer
  • Wenden Sie die TF-IDF-Codierung (Term-Häufigkeit – inverse Dokumenthäufigkeit) auf Klassifizierungs-, Ähnlichkeits-, Regressions- oder Clustering-Lösungen an.

    Vorbereitungen

    Erforderliche Rolle: admin oder ml_admin
    Hinweis:
    Die Konfiguration von erweiterten Einstellungen für ML-Lösungen ist optional. Wenn Sie Einstellungen dieser Art konfigurieren, stellen Sie sicher, dass Sie gut über die Technologie informiert sind, die Sie in der Lösung aktivieren, und dass Sie einen Anwendungsfall haben, der von der Technologie profitiert.
    • Erstellen Sie eine Ähnlichkeitslösungsdefinition, oder verwenden Sie eine vorhandene.
    • Erstellen Sie eine Klassifizierungslösungsdefinition, oder verwenden Sie eine vorhandene.wo
    • Erstellen Sie eine Definition der Regressionslösung, oder verwenden Sie eine vorhandene.
    • Wenn Sie ein Professional-Abonnement haben und Predictive Intelligence zum ersten Mal in Vancouverimplementieren, erstellen Sie eine Clustering-Lösungsdefinition, oder verwenden Sie eine vorhandene.
    • Erforderliche Rolle: admin oder ml_admin

    Warum und wann dieser Vorgang ausgeführt wird

    Predictive Intelligence verwendet standardmäßig die Einbettung von Absatzvektorwörtern in seinen Klassifizierungs-, Ähnlichkeits- und Regressions-Frameworks, was sehr effektiv für die Verarbeitung von Daten ist, die hauptsächlich aus lesbaren Inhalten bestehen. TF-IDF kann jedoch manchmal bessere Vorhersageergebnisse für Datensätze zurückgeben, die maschinell generierte Inhalte aufweisen, z. B. Warnungen und Fehlermeldungen für Protokolldateien. Sie haben hier also die Wahl je nach Art der Daten, die Ihre Lösung verarbeitet.

    Hinweis:
    Die Schritte zum Konfigurieren von TF-IDF sind für alle Modell-Frameworks gleich, aber die IF-IDF-Unterstützung für Clustering-Lösungsdefinitionen ist nur anwendbar, wenn Sie ein Professional-Abonnement haben und [] ab VancouverPredictive Intelligence zum ersten Mal implementieren.

    Prozedur

    1. Navigieren Sie zu einer Lösungsdefinition, z. B. Alle > Predictive Intelligence > Ähnlichkeit > Lösungsdefinitionen.
    2. Öffnen Sie ein Lösungsdefinitionsformular.
      In diesem Beispielszenario verwenden Sie ein CMBD-Ähnlichkeitsdefinitionsformular.
      Eine Beispieldefinition einer Ähnlichkeitslösung, auf die Sie den Parameter TF-IDF anwenden.
    3. Klicken Sie auf der Registerkarte „Erweiterte Lösungseinstellungen“ im Abschnitt „Zugehörige Links“ des Formulars auf Neu.
      So wählen Sie die Option „Lösungsparameter“ zum Erstellen des Parameters aus.
    4. Erstellen Sie einen Parameterdatensatz.
      1. Klicken Sie im Feld Lösungsparameter auf das Suchsymbol.
      2. Wählen Sie im Bildschirm „ML -Lösungsparameter“ die Option tf-idf zum Generieren von Vektoren verwenden aus.
      So erstellen Sie den Parameterdatensatz, indem Sie auf die Schaltfläche „Suchen“ und dann auf die Kurzbeschreibung des TF-IDF-Schlüssels klicken.
    5. Klicken Sie auf Absenden.

      Der Bildschirm mit dem Datensatz der erweiterten Lösungseinstellung wird aktualisiert.

      Sehen Sie sich den neuen Datensatz der erweiterten Lösungseinstellung an, den Sie erstellt haben.
    6. Klicken Sie auf Absenden.

      Ergebnis: TF-IDF ist für Ihre Ähnlichkeitslösung konfiguriert. Der Lösungsparameter wird auf der Registerkarte Erweiterte Lösungseinstellungen Ihres Ähnlichkeitsdefinitionsformulars angezeigt.

      Diese Abbildung zeigt den Datensatz der erweiterten Lösungseinstellung für TF-IDF.