Erstellen und trainieren Sie eine Regressionslösung
Trainieren Sie Ihre Lösung, indem Sie Verlaufsdaten verwenden, um numerische Ausgaben vorherzusagen, z. B. Temperatur oder Aktienkurs. Beispielsweise können Sie mithilfe der Regression schätzen, wie lange es dauert, einen Incident oder Fall zu lösen.
Vorbereitungen
Erforderliche Rolle: ml_admin oder admin
Warum und wann dieser Vorgang ausgeführt wird
- Der mittlere absolute Fehler (Mean Absolute Error, MAE) misst die durchschnittliche Abweichung eines vorhergesagten Werts vom Ist-Wert. Diese Metrik ist nützlich, da sie leicht zu verstehen ist, da ihre Skala mit der ihres Ziels identisch ist. MAE ist jedoch ungebunden, was den Vergleich zwischen Modellen erschwert.
- Der symmetrische mittlere absolute prozentuale Fehler (Symmetric Mean Absolute Percentage Error, SMAPE) ist ein Prozentwert der Abweichung vom Vorhersagewert zum Istwert. SMAPE ist eine begrenzte Version von MAE, hat jedoch einen Wertebereich zwischen 0 und 100. Je niedriger der SMAPE-Wert, desto besser ist die Modellgenauigkeit.
- Die Bereichsgenauigkeit ist der Prozentsatz der Ist-Werte innerhalb eines vorhergesagten Bereichs. Mit anderen Worten: Es handelt sich um den Bereich zwischen der Ober- und Untergrenze der Vorhersage. Wenn beispielsweise vier von fünf Ist-Werten innerhalb des vorhergesagten Bereichs liegen, beträgt die Bereichsgenauigkeit 80 %.
- Diedurchschnittliche Intervallbreite ist die Differenz zwischen der Ober- und Untergrenze der Vorhersage. Diese Metrik erklärt, wie aussagekräftig das Intervall ist. Je kleiner die durchschnittliche Breite, desto besser das Modell
Bei Vorhersagen können Sie mit der Regression auch ein Konfidenzniveau für das Vorhersageintervall (Bereich) angeben.
In diesem Beispielverfahren erstellen und trainieren Sie eine Regressionslösungsdefinition, um vorherzusagen, wie lange die Wiederherstellung einer Cloud-Datenbank dauert.
Prozedur
Nächste Maßnahme
In diesem Beispielszenario haben Sie eine ML-Lösung aus Ihrer Lösungsdefinition erstellt. Die Registerkarten Lösungsstatistiken, Testlösung und Lösungsdefinition werden im Abschnitt „Zugehörige Links“ Ihrer ML-Lösung angezeigt.
Überprüfen Sie auf der Registerkarte Lösungsstatistiken die von Ihrer Lösung generierten Statistiken zur Punktschätzung und zum Bereich (Vorhersageintervall).
Auf der Registerkarte Testlösungen Ihrer Lösung können Sie die Vorhersageausgabe für die Datensätze testen, die Sie als Eingabe für die Vorhersage verwendet haben, indem Sie Werte für die Eingabefelder eingeben, z. B. Quellrechenzentrum, Zielrechenzentrumund Datenbankgröße. Sie können das Standard-Konfidenzniveau der Vorhersage von 95 verwenden oder einen anderen Wert zwischen 0 und 100 eingeben. Die Verwendung von 95 als Wert bedeutet, dass das System zu 95 % sicher ist, dass die tatsächliche Vorhersage in das Vorhersageintervall fällt. Klicken Sie auf die Schaltfläche Test ausführen, um die Vorhersageausgabe zu suchen.
Nachdem Sie den Test ausgeführt haben, werden die Ausgabestatistiken der Vorhersage angezeigt. Die „Punktschätzung“ im Bildschirm ist ein einzelner Wert: ein bestimmter Zeitpunkt. Beispielsweise dauert die Datenbankwiederherstellung 134,47 Sekunden. Die Unter- und Obergrenzen auf dem Bildschirm geben einen Bereichsgenauigkeitswert an. Beispielsweise dauert die Datenbankwiederherstellung zwischen 84,53 und 185,41 Sekunden.