Konfigurieren Sie TF-IDF für -Lösungen
Wenden Sie die TF-IDF-Codierung (Term-Häufigkeit – inverse Dokumenthäufigkeit) auf Klassifizierungs-, Ähnlichkeits-, Regressions- oder Clustering-Lösungen an.
Vorbereitungen
Hinweis:
Die Konfiguration von erweiterten Einstellungen für ML-Lösungen ist optional. Wenn Sie Einstellungen dieser Art konfigurieren, stellen Sie sicher, dass Sie gut über die Technologie informiert sind, die Sie in der Lösung aktivieren, und dass Sie einen Anwendungsfall haben, der von der Technologie profitiert.
- Erstellen Sie eine Ähnlichkeitslösungsdefinition, oder verwenden Sie eine vorhandene.
- Erstellen Sie eine Klassifizierungslösungsdefinition, oder verwenden Sie eine vorhandene.wo
- Erstellen Sie eine Definition der Regressionslösung, oder verwenden Sie eine vorhandene.
- Wenn Sie ein Professional-Abonnement haben und Predictive Intelligence zum ersten Mal in Vancouverimplementieren, erstellen Sie eine Clustering-Lösungsdefinition, oder verwenden Sie eine vorhandene.
- Erforderliche Rolle: admin oder ml_admin
Warum und wann dieser Vorgang ausgeführt wird
Predictive Intelligence verwendet standardmäßig die Einbettung von Absatzvektorwörtern in seinen Klassifizierungs-, Ähnlichkeits- und Regressions-Frameworks, was sehr effektiv für die Verarbeitung von Daten ist, die hauptsächlich aus lesbaren Inhalten bestehen. TF-IDF kann jedoch manchmal bessere Vorhersageergebnisse für Datensätze zurückgeben, die maschinell generierte Inhalte aufweisen, z. B. Warnungen und Fehlermeldungen für Protokolldateien. Sie haben hier also die Wahl je nach Art der Daten, die Ihre Lösung verarbeitet.
Hinweis:
Die Schritte zum Konfigurieren von TF-IDF sind für alle Modell-Frameworks gleich, aber die IF-IDF-Unterstützung für Clustering-Lösungsdefinitionen ist nur anwendbar, wenn Sie ein Professional-Abonnement haben und [] ab VancouverPredictive Intelligence zum ersten Mal implementieren.