Bezeichnung „andere“ entfernen
Reduzieren Sie das Rauschen in Ihrem Klassifizierungsmodell, und verbessern Sie die Vorhersagegenauigkeit, indem Sie Datensätze mit der Bezeichnung „andere“ aus Schulungsdaten entfernen. Dies sind Datensätze mit einer Verteilungshäufigkeit von weniger als einem Prozent.
Vorbereitungen
Erforderliche Rolle: Ml_admin oder admin
Warum und wann dieser Vorgang ausgeführt wird
Wenn diese Option auf „wahr“ festgelegt ist, werden Datensätze unter 1 % der Gesamtdatenverteilung vom Training ausgeschlossen. Diese Datensätze werden in der -Schnittstelle mit „Sonstige“ gekennzeichnet. Der Schwellenwert von 1 % kann nicht geändert werden.
Sie können diese Option im Formular „Lösungsdefinition“ wie folgt hinzufügen. Alternativ können Sie diese Option mithilfe eines Skripts hinzufügen.
So fügen Sie diese Option mithilfe eines Skripts hinzu:
config.removeOthersLabel(true);Im JSON-Format:
{
"remove_others_label": true
}
Prozedur
Ergebnisse
Die Einstellung wird als Zeile auf der angezeigt Erweiterte Lösungseinstellung Registerkarte im Formular Ihrer Lösung.
Nächste Maßnahme
Trainieren Sie Ihre Lösung erneut.