Klassifizierungslösung erstellen und trainieren

  • Freigeben Version: Zurich
  • Aktualisiert 31. Juli 2025
  • 6 Minuten Lesedauer
  • Geben Sie die Datensätze an, die zum Trainieren einer Klassifizierungslösung verwendet werden, welche Felder eine Vorhersage auslösen und wie oft Ihre Lösung neu trainiert werden soll.

    Vorbereitungen

    Wichtig:
    In Zurich Release verwenden Modelle in den Frameworks für Klassifizierung, Clustering und Ähnlichkeit Workflow-Lösungen. Diese sind vortrainiert, sodass für Ihre neuen Lösungen kein Wortkorpus erforderlich ist. Wenn Ihre vorhandenen Lösungen mit einem Wortkorpus nach dem Upgrade erneut trainiert werden, werden sie zu Workflow-Lösungen, und das Feld Wortkorpus wird aus dem Formular entfernt.

    Warum und wann dieser Vorgang ausgeführt wird

    Ein Vorhersagemodell ist nur so gut wie die Daten, die Sie zum Trainieren verwenden. Um geeignete Datensätze für das Training auszuwählen, überprüfen Sie das Datenbankwörterbuch der Tabelle sowie die aktuelle Qualität der Datensatzwerte, die Sie verwenden möchten.

    Informationen zur Verwendung verschlüsselter Trainingsdaten finden Sie unter Datenverschlüsselung in Predictive Intelligence.

    Informationen zur minimalen und maximalen Anzahl von Datensätzen, die Sie für Schulungen verwenden können, finden Sie unter Predictive Intelligence -Eigenschaften.

    Hinweis:
    Klassen, die weniger als 30 Datensätze in Ihrem Schulungsdatensatz enthalten, werden vom Lösungstraining ausgeschlossen. Wenn das Training abgeschlossen ist, werden alle ausgeschlossenen Klassen im Abschnitt „Lösungsstatistiken“ Ihres ML-Lösungsformulars aufgeführt.

    Alle Klassen, die von Ihrem Lösungstraining ausgeschlossen wurden, werden im Abschnitt „Lösungsstatistiken“ des ML-Lösungsformulars Ihrer trainierten Lösung aufgeführt.

    Sie müssen für jedes Vorhersagemodell, das Sie unterstützen möchten, eine separate Lösungsdefinition erstellen. Im folgenden Verfahren wird erläutert, wie eine neue Klassifizierungslösung erstellt wird. Sie können jedoch auch eine vorhandene Lösungsdefinition und ihre Konfiguration in einen neuen Datensatz kopieren, indem Sie auswählen Lösungsdefinition Kopieren Aus dem Kontextmenü. Bearbeiten Sie die Feldwerte im neuen Datensatz nach Bedarf.

    Von Yokohama Release können Sie auch eine Workflow-Klassifizierungslösung mithilfe eines Skripts erstellen, wenn Sie eine Analyse der wichtigsten Funktionen einschließen möchten, die die Vorhersagen des Modells beeinflussen. Weitere Informationen finden Sie unter Modellerklärbarkeit.

    Prozedur

    1. Stellen Sie sicher, dass Sie sich im gewünschten Anwendungsbereich für Ihre Lösungsdefinition befinden, und navigieren Sie dann zu Alle > Predictive Intelligence > Klassifizierung > Lösungsdefinitionenan.
    2. Wählen Sie in der Liste Klassifizierungsdefinitionen die Option aus Neu .
    3. Konfigurieren Sie die Felder im leeren Formular „Klassifizierungsdefinition“ gemäß der folgenden Anleitung.
      Feld Wert
      Bezeichnung Geben Sie einen eindeutigen Namen für den Lösungsdatensatz ein.
      Name Das System generiert den Wert dieses schreibgeschützten Felds auf Grundlage der von Ihnen eingegebenen Bezeichnung.
      Wortkorpus

      Wählen Sie einen Wortkorpus aus, der für Ihre Lösung relevant ist. Weitere Informationen finden Sie unter Wortkorpus erstellen.

      Hinweis:
      Wortkorpus ist kein Pflichtfeld für Kunden, die implementieren Predictive Intelligence Zum ersten Mal beginnend in Utah. Stattdessen wird ein vortrainiertes Modell verwendet. Das Feld Wortkorpus wird für vortrainierte Modelle entfernt.
      Tabelle Wählen Sie die Tabelle aus, die die Zieldatensätze enthält, die das System vorhersagen soll.
      Ausgabefeld

      Wählen Sie das Feld aus, dessen Wert das Vorhersagemodell festlegen soll.

      Im Allgemeinen hat ein gutes Ausgabefeld diese Eigenschaften.
      • Dies ist ein Auswahlfeld oder ein Zeichenfolgenfeld mit einer endlichen Menge möglicher Werte.
      • Es besteht ein Kausalzusammenhang zu den Eingabefeldern.

      Beispiel: Auf der Standard Incident-Kategorisierung Lösungsdefinition, das Ausgabefeld ist auf festgelegt Kategorie .

      Felder

      Wählen Sie die Eingabefelder aus, die die Lösung zum Generieren einer Vorhersage verwenden soll.

      Eingabefelder sind Felder in einem Datensatz, die die Klassifizierungsinformationen enthalten können, die ihre Vorhersagelösung benötigt, um erfolgreich zu sein. Wenn Sie beispielsweise die richtige Klasse für die Selektierung eines Incident-Datensatzes vorhersagen, sollte die Vorhersage Datensätze mit Text sammeln, der auf die Klasse verweist. Die meisten Datensätze weisen kontextbezogenen Text im Feld Kurzbeschreibung auf, weswegen es sich in der Regel empfiehlt, dieses Eingabefeld zu nutzen. Sie können auch Auflösungshinweise als Eingabefeld verwenden, da es in den detaillierten Hinweisen für den Incident ebenfalls auf die Incident-Klasse verweisen kann.

      Im Allgemeinen haben gute Eingabefelder diese Eigenschaften.
      • Die Felder stehen Benutzern beim Erstellen von Datensätzen zur Verfügung.
      • Der Datentyp des Felds kann Zeichenfolge, Referenz, Auswahl oder HTML sein. Je mehr Informationen ein Feld bereitstellt, desto häufiger kann eine Lösung eine Vorhersage treffen, und desto häufiger sind Vorhersagen genau.
      • Das Feld hat einen Standardwert und darf nicht leer sein.

      Alle standardmäßigen Lösungsdefinitionen verwenden das Feld Kurzbeschreibung.

      Filter

      Klicken Sie auf Filterbedingung hinzufügen, um Bedingungen auf die Datensätze anzuwenden, die Sie trainieren.

      Die Lösungsdefinition Incident-Kategorisierung verwendet beispielsweise einen Filter mit folgenden Bedingungen: [Erstellt][am][Letzte 12 Monate] UND [Aktiv][ist][false] UND [Status][ist Bestandteil von][Gelöst | Abgeschlossen].

      Um eine Lösung zu trainieren, muss der Filter mindestens einen Datensatz zurückgeben. Wenn Ihr Filter keine Datensätze zurückgibt, aktualisieren Sie ihn, bis er Datensätze zum Trainieren zurückgibt.
      Hinweis:
      Die empfohlene Anzahl von Datensätzen für das Trainieren einer guten Lösung liegt zwischen 30.000 und 300.000. Wenn Sie mehr als 300.000 Datensätze einreichen, werden die neuesten 300.000 Datensätze zum Trainieren der Lösung verwendet. Verwenden Sie nur authentische Datensätze aus der Datenbank.
      Im Allgemeinen hat ein guter Filter diese Eigenschaften.
      • Die Schulungsdatensätze sind inaktiv, und ihr status zeigt die Arbeit an, die innerhalb Ihres Standardprozesses abgeschlossen wurde, z. B. „gelöst“ oder „Geschlossen“.
      • Die Zielfelder enthalten nur die richtigen Werte. Filtern Sie Datensätze mit unzuverlässigen Zielfeldwerten heraus. Wenn Sie beispielsweise die Zuweisungsgruppe/-Kategorie vorhersagen und Ihre historischen Incident-Daten Zuweisungsgruppen/-Kategorien enthalten, die nicht mehr verwendet werden, fügen Sie einen Filter hinzu, um solche Datensätze aus dem Training zu entfernen.
      • Die Trainingsdatensätze enthalten mehrere Beispiele für jeden Zielfeldwert, den die Lösung vorhersagen soll.
      • Die Trainingsdatensätze enthalten übliche Variationen der Eingabefelder.

      Verwenden Sie relative Datumsfilter wie Letzte 3 Monate oder Letzte 12 Monate. Verwenden Sie keine hartcodierten Daten, da diese Filter beim erneuten Trainieren der Lösungen nicht aktualisiert werden, es sei denn, Sie aktualisieren sie manuell.

      Verarbeitungssprache Wählen Sie die dominante Sprache des Datensatzes aus, den Sie für die Lösungsdefinition trainieren. Wenn die Datensatzsprache Italienisch ist, wählen Sie Italienisch aus. Außerdem werden alle Datensätze standardmäßig auch in Englisch verarbeitet. Wenn Sie beispielsweise Italienisch auswählen, verarbeitet das System die Daten sowohl in Englisch als auch in Italienisch.
      Hinweis:
      Der Begriff Verarbeitung beinhaltet einige der sprachspezifischen Schritte, die im Rahmen des Trainings einer Lösung verwendet werden. Zum Beispiel das Versehen von Wörtern mit Token, das Entfernen von Stoppwörtern und die Wortstammerkennung.
      Stoppwörter Wenn Sie Ihre Verarbeitungssprache auswählen, fügt das System automatisch eine Stoppwortliste für diese Sprache hinzu. Wenn Ihre Verarbeitungssprache beispielsweise Italienisch ist, wird die Liste für standardmäßige italienische Stoppwörter angezeigt. Die Standardmäßige Englische Stoppwörter Liste ist ebenfalls enthalten. Wenn Sie eine anwenderdefinierte Stoppwortliste erstellen, können Sie sie im Feld Stoppwörter auswählen, um sie Ihrer Lösung hinzuzufügen.
      Schulungs­häufigkeit
      Wählen Sie aus, wie oft das System die Lösung neu generiert. Die verfügbaren Optionen reichen von Einmal ausführen Bis zu Alle 180 Tage .
      Hinweis:
      Die Mindestanzahl von Datensätzen, die für das Training zur Klassifizierungslösung erforderlich sind, ist auf 000 festgelegt.

      Standardmäßig führt das System einmal ein Training durch. Dies gibt Ihnen Zeit, die Lösungsdefinition zu überprüfen und zu aktualisieren, bis sie akzeptable Abdeckungs- und Genauigkeitswerte bereitstellt.

      Wenn Ihre Lösungsdefinition relativ stabil ist, sollten Sie regelmäßige Trainings in Betracht ziehen, da die Daten mit der Zeit altern können, wodurch die Genauigkeit Ihres Vorhersagemodells beeinträchtigt wird.

      Hinweis:
      Der ML-Planer begrenzt die Anzahl der Schulungen, die eine Instanz innerhalb eines 24-Stunden-Fensters auf 50 neue ML-Schulungsanforderungen pro Instanz festlegen kann. Dieser Grenzwert schließt geplante Wiederholungsanforderungen, Clustering-Updates und Ähnlichkeitsaktualisierungen aus, auch wenn die neuen Schulungsanforderungen innerhalb eines 24-Stunden-Fensters 50 überschreiten.
    4. Wählen Sie die entsprechende Kontextmenüoption aus, bzw. klicken Sie auf die entsprechende Schaltfläche für die Lösungsdefinition.
      OptionBeschreibung
      „Speichern“ oder „Speichern und schulen“ Speichern Sie den Lösungsdefinitionsdatensatz, damit Sie später dorthin zurückkehren können, oder speichern und übermitteln Sie ihn zum Trainieren.
      „Übermitteln“ oder „Übermitteln und schulen“ Erstellen Sie einen Lösungsdefinitionsdatensatz, und übermitteln Sie ihn, oder übermitteln und trainieren Sie ihn.
    5. Wenn Sie die Lösung zum Trainieren übermittelt haben, klicken Sie im Fenster Trainingsaktivierung zur Bestätigung auf OK.
      • Das System plant das Trainieren der Lösung beim nächstgelegenen Trainingsservice. Das System sendet Ihnen bei Abschluss des Trainings eine Benachrichtigung und informiert Sie über alle aufgetretenen Fehler. Andere Benutzer können die Kategorie „Predictive Intelligence-Benachrichtigungen“ abonnieren. Nach Abschluss des Trainings lädt das System die Lösung als Anhangsdatensatz hoch.
      • Auf der Registerkarte „Lösungsvisualisierung“ Ihres Lösungsformulars wird ein Blasendiagramm angezeigt, das für alle von der Lösung abgedeckten Klassen die geschätzte Genauigkeit und Abdeckung darstellt. Die Größe der Blase gibt den Prozentsatz der Datensätze (Verteilung) an, die zur Klasse gehören. Wenn Sie auf eine Blase zeigen, sehen Sie die geschätzte Abdeckung, die geschätzte Genauigkeit und die Verteilung.
      Die geschätzte Genauigkeit und Abdeckung für jede der von der Lösung abgedeckten Klassen.

    Nächste Maßnahme

    Überprüfen Sie im Abschnitt „Klassenkonfidenz“ auf der Registerkarte „Lösungsstatistiken“ Ihrer Lösung die Statistiken zur Präzision und Abdeckung der trainierten Lösung.

    Auf der Registerkarte Testlösungen in Ihrer Lösung können Sie die Vorhersageausgabe testen, indem Sie Werte aus den Eingabefeldern eingeben, z. B. die Kurzbeschreibung.

    So testen Sie die Vorhersageausgabe für die Datensätze, die Sie als Eingabe für die Vorhersage verwendet haben, indem Sie Werte aus den Eingabefeldern eingeben, z. B. die Kurzbeschreibung