Erstellen und trainieren Sie eine Regressionslösung

  • Freigeben Version: Zurich
  • Aktualisiert 31. Juli 2025
  • 6 Minuten Lesedauer
  • Trainieren Sie Ihre Lösung, indem Sie Verlaufsdaten verwenden, um numerische Ausgaben wie eine Temperatur oder einen Aktienkurs vorherzusagen. Sie können beispielsweise Regression verwenden, um die Zeit zu schätzen, die zur Lösung eines Incident oder Falls benötigt wird.

    Vorbereitungen

    Wichtig:
    Unterstützung für neue Regressionslösungen ist in veraltet Zurich Release. Sie können weiterhin vorhandene Lösungen bearbeiten und trainieren, aber Sie können keine neuen Lösungen erstellen.

    Erforderliche Rolle: Ml_admin oder admin

    Warum und wann dieser Vorgang ausgeführt wird

    Mit Regressionslösungen können Sie einen Zeitpunkt schätzen und ein Intervall vorhersagen. Das resultierende Modell liefert die folgenden Statistiken:
    • Mittlerer Absoluter Fehler (MAE), der die mittlere Abweichung eines vorhergesagten Werts vom ist-Wert misst. Diese Metrik ist nützlich, da sie leicht zu verstehen ist, da ihre Skalierung mit der des Ziels übereinstimmt. MAE ist jedoch nicht begrenzt, was den Vergleich zwischen Modellen schwierig macht.
    • Symmetrischer Mittlerer Absoluter Prozentualer Fehler (SMAPE) ist ein Prozentwert der Abweichung vom vorhergesagten zum tatsächlichen Wert. SMAPE ist eine gebundene Version von MAE, mit der Ausnahme, dass sie einen Wertebereich zwischen 0 und 100 hat. Je niedriger der SMAPE-Wert, desto besser ist die Modellgenauigkeit.
    • Bereichsgenauigkeit Ist der Prozentsatz der ist-Werte zwischen einem vorhergesagten Bereich. Mit anderen Worten: Dies ist der Bereich zwischen dem oberen und unteren Grenzwert der Vorhersage. Wenn beispielsweise vier von fünf ist-Werten innerhalb des vorhergesagten Bereichs liegen, beträgt die Bereichsgenauigkeit 80 %.
    • Durchschnittliche Intervallbreite Ist der Unterschied zwischen dem oberen und unteren Grenzwert der Vorhersage. Diese Metrik erklärt, wie informativ das Intervall ist. Je kleiner die durchschnittliche Breite, desto besser das Modell

    Bei Vorhersagen können Sie mit der Regression auch ein Konfidenzniveau für das Vorhersageintervall (Bereich) angeben.

    In diesem Beispielverfahren erstellen und trainieren Sie eine Regressionslösungsdefinition, um vorherzusagen, wie lange die Wiederherstellung einer Cloud-Datenbank dauert.

    Prozedur

    1. Navigieren zu Alle > Predictive Intelligence > Regression > Lösungsdefinitionenan.
    2. Klicken Sie in der Liste Regressionsdefinitionen auf Neu .
    3. Konfigurieren Sie diese Felder im Formular „Regressionsdefinition“ gemäß der folgenden Anleitung.
      Feld Wert
      Bezeichnung Geben Sie einen eindeutigen Namen für die Regressionslösung ein. In diesem Anwendungsfall könnten Sie beispielsweise eingeben Regressionstest für DB-Wiederherstellung .
      Name Wenn Sie eine Lösungsbezeichnung eingeben, wird dieses Feld automatisch mit einem vom System zugewiesenen Namen gefüllt, der Ihrem Bezeichnungswert ähnelt.
      Wortkorpus

      Wählen Sie einen vorhandenen, für Ihre Lösung relevanten Wortkorpus aus. In diesem Anwendungsfall wählen Sie beispielsweise einen Wortkorpus mit einem Titel wie Incidents in den letzten 3 Monaten aus.

      Wenn Sie keinen relevanten Wortkorpus haben, führen Sie die Schritte aus Dient zum Erstellen eines Wortkorpus Zuerst. Wenn der Wortkorpus vollständig ist, können Sie ihn im Feld „Wortkorpus“ in Ihrem Formular für Regressionsdefinitionen auswählen.

      Die Auswahl des Wortkorpus ist jedoch optional. Wenn Ihre Eingabedaten Textspalten enthalten und Sie keinen Wortkorpus auswählen, trainiert Ihre Regressionslösung ein neues Wortkorpusmodell anhand der Textspalten in Ihren Eingabedaten. Der resultierende Wortkorpus kann in einer anderen Regressionslösung oder einem anderen ML-Lösungstyp wiederverwendet werden.

      Hinweis:
      Für Anwender, die aktiviert haben, wird anstelle des Wortkorpus ein vortrainiertes Modell verwendet Predictive Intelligence Beginnt in Utah.
      Tabelle Wählen Sie die Datenbanktabelle aus, auf die Sie die Regression anwenden. Die Tabelle sollte historische Datensätze enthalten, die das System verwenden kann, um die Dauer der Datenbankwiederherstellung vorherzusagen.
      Ausgabefeld

      Wählen Sie das Feld aus, dessen Wert das Vorhersagemodell festlegen soll.

      Im Allgemeinen ist ein gutes Ausgabefeld ein numerisches Feld, ein Ganzzahlfeld oder ein Gleitkommafeld.

      In diesem Beispielszenario verwenden Sie Dauer Feld zum Messen einer Zeitdauer. Das Ausgabefeld sollte einen numerischen Wert generieren.

      Felder Wählen Sie einen oder mehrere Feldtypen aus, die das System beim Identifizieren der Datensätze unterstützen, die Sie mithilfe der Regression trainieren möchten. In diesem Beispielszenario verwenden Sie Kurzbeschreibung , Quelldatenzentrum , Zieldatenzentrum , Und Datenbankgröße . (Short_description, Sourcedc, Targetdc und DBsize.) Eingabefeldtypen können Zeichenfolge, nominal oder numerisch sein.
      Filter (Optional) Fügen Sie den Ausgabefelddatensätzen Filterbedingungen hinzu, die Sie mit Regression trainieren möchten.
      Hinweis:
      • Die Mindestanzahl von Datensätzen für das Regressionstraining beträgt 10.000 Datensätze.
      • Die Höchstanzahl von Datensätzen für das Regressionstraining ist auf 300.000 beschränkt.
      Verarbeitungssprache Wählen Sie die primäre Sprache des Datensatzes aus, den Sie für die Lösungsdefinition trainieren. Wenn die Datensatzsprache Italienisch ist, wählen Sie Italienisch aus. Außerdem werden alle Datensätze standardmäßig auch in Englisch verarbeitet. Wenn Sie beispielsweise Italienisch auswählen, verarbeitet das System die Daten sowohl in Englisch als auch in Italienisch.
      Hinweis:
      Der Begriff Verarbeitung beinhaltet einige der sprachspezifischen Schritte, die im Rahmen des Trainings einer Lösung verwendet werden. Diese Schritte umfassen das Tokenisieren von Wörtern, das Entfernen von Stoppwörtern und das Stemmming.
      Stoppwörter Nachdem Sie die Verarbeitungssprache ausgewählt haben, fügt das System automatisch eine Stoppwortliste in derselben Sprache hinzu. Wenn Ihre Verarbeitungssprache beispielsweise Italienisch ist, wird die verwendet Standardmäßige Italienische Stoppwörter Liste wird angezeigt. Die Standardmäßige Englische Stoppwörter Liste wird auch in Ihrer Auswahl angezeigt. Wenn Sie eine benutzerdefinierte Stoppwortliste erstellen, können Sie sie im Feld „Stoppwörter“ auswählen, um sie Ihrer Lösung hinzuzufügen. In diesem Szenario verwenden Sie die Liste für standardmäßige englische Stoppwörter.
      Schulungs­häufigkeit
      Wählen Sie aus, wie oft das System die Lösung basierend auf den Datensätzen, die dem Filter entsprechen, neu generiert. Folgende Optionen stehen zur Verfügung:
      • Einmal ausführen
      • Alle 30 Tage
      • Alle 60 Tage
      • Alle 90 Tage
      • Alle 120 Tage
      • Alle 180 Tage

      In diesem Szenario wählen Sie „Alle 30 Tage“ aus.

      Standardmäßig führt das System einmal ein Training durch. Dies gibt Ihnen Zeit, die Lösungsdefinition zu überprüfen und nach Bedarf zu aktualisieren, bis sie akzeptable Werte für Abdeckung und Genauigkeit liefert.

      Hinweis:
      • Die Mindestanzahl von Datensätzen, die für das Training von Regressionslösungen erforderlich sind, ist auf 000 festgelegt.
      • Der ML-Planer begrenzt die Anzahl der Schulungen, die eine Instanz innerhalb eines 24-Stunden-Fensters auf 50 neue ML-Schulungsanforderungen pro Instanz festlegen kann. Dieser Grenzwert schließt geplante Anforderungen für ein erneutes Training aus. Darüber hinaus sind Clustering und Ähnlichkeitsaktualisierungen ebenfalls von diesem Grenzwert ausgeschlossen, auch wenn die neuen Schulungsanforderungen innerhalb eines 24-Stunden-Fensters 50 überschreiten.
    4. Wählen Sie die entsprechende Kontextmenüoption aus, bzw. klicken Sie auf die entsprechende Schaltfläche für die Lösungsdefinition.
      OptionBeschreibung
      „Speichern“ oder „Speichern und schulen“ Speichern Sie den Lösungsdefinitionsdatensatz, damit Sie später dorthin zurückkehren können, oder speichern und übermitteln Sie ihn zum Trainieren.
      „Übermitteln“ oder „Übermitteln und schulen“ Erstellen Sie einen Lösungsdefinitionsdatensatz, und übermitteln Sie ihn, oder übermitteln und trainieren Sie ihn.
    5. Wenn Sie die Lösung zum Trainieren übermittelt haben, klicken Sie im Fenster Trainingsaktivierung zur Bestätigung auf OK.

      Das System plant das Trainieren der Lösung beim nächstgelegenen Trainingsservice. Das System sendet Ihnen bei Abschluss des Trainings eine Benachrichtigung und informiert Sie über alle aufgetretenen Fehler. Auch alle anderen Benutzer können die Kategorie „Predictive Intelligence-Benachrichtigungen“ abonnieren. Nach Abschluss des Trainings lädt das System die Lösung als Anhangsdatensatz hoch.

    Nächste Maßnahme

    In diesem Beispielszenario haben Sie eine ML-Lösung aus Ihrer Lösungsdefinition erstellt. Die Registerkarten Lösungsstatistiken, Testlösung und Lösungsdefinition werden im Abschnitt zugehörige Links Ihrer ML-Lösung angezeigt.

    Überprüfen Sie auf der Registerkarte Lösungsstatistiken die von Ihrer Lösung generierten Punktschätzungs- und Bereichsstatistiken (Vorhersageintervall).

    Die Vorhersagestatistiken für die von Ihnen erstellte und trainierte Lösung.

    Auf der Registerkarte Testlösungen Ihrer Lösung können Sie die Vorhersageausgabe für die Datensätze testen, die Sie als Eingabe für die Vorhersage verwendet haben, indem Sie Werte für die Eingabefelder eingeben, z. B. Quelldatenzentrum , Zieldatenzentrum , Und Datenbankgröße . Sie können das Standard-Konfidenzniveau der Vorhersage von 95 verwenden oder einen anderen Wert zwischen 0 und 100 eingeben. Die Verwendung von 95 als Wert bedeutet, dass das System zu 95 % sicher ist, dass die tatsächliche Vorhersage in das Vorhersageintervall fällt. Klicken Sie auf die Schaltfläche Test ausführen, um die Vorhersageausgabe zu suchen.

    Die Werte, die Sie eingeben müssen, um einen Vorhersageausgabetest auszuführen.

    Nachdem Sie den Test ausgeführt haben, werden die Ausgabestatistiken der Vorhersage angezeigt. Die „Punktschätzung“ im Bildschirm ist ein einzelner Wert: ein bestimmter Zeitpunkt. Beispielsweise dauert die Datenbankwiederherstellung 134,47 Sekunden. Die unteren und oberen Grenzwerte auf dem Bildschirm bedeuten einen Genauigkeitswert für den Bereich. Beispielsweise dauert die Datenbankwiederherstellung zwischen 84,53 und 185,41 Sekunden.

    Die Testausgabewerte für die Vorhersagen der Punktschätzung und der Bereichsgenauigkeit.