Ihr Modell testen und veröffentlichen
Bewerten Sie die Leistung Ihres Modells NLU, um Bereiche mit Verbesserungspotenzial zu identifizieren. Veröffentlichen Sie dann Ihr Modell, um es für andere Anwendungen wie Virtual Agentverfügbar zu machen.
Zusammenfassungsnutzung
Testen Sie Ihr Modell Virtual Agent oder KI-Suche mit seinem Standardtestsatz, um zu sehen, wie das Modell reagiert. Testergebnisse enthalten Informationen, mit denen Sie Ihr Modell verbessern können.
Um Ihr Modell zu testen, navigieren Sie zu . Wählen Sie die Registerkarte für die Anwendung Ihres Modells und dann den Namen des Modells aus. Wählen Sie auf der Karte Testen und veröffentlichen Sie Ihr Modelldie Option Ansichtsphase aus.
Übersicht über das Testen und Veröffentlichen Ihres Modells
Die Phase Modell testen und veröffentlichen wird standardmäßig auf der Seite Übersicht geöffnet. Hier befinden sich die Schaltflächen „Neuen Test ausführen“ und „Modell veröffentlichen“.
Die Übersicht liefert Informationen zu einem vorherigen Testlauf und enthält Balkendiagramme, die die Testergebnisse zusammenfassen.
Wenn Sie über frühere Testläufe verfügen, können Sie diese anzeigen, indem Sie in der Liste Testlaufdatum auswählen.
Um in der Testergebnistabelle einen Drilldown durchzuführen, wählen Sie die Registerkarte Detaillierte Ergebnisse. Jede Testäußerung wird mit ihrer Vorhersage unter Detaillierte Ergebnisseaufgelistet.
Testergebnisse verstehen
Die Testergebnisse zeigen, wie Ihr Modell auf die Äußerungen im Testsatz reagiert hat.
| Prozentsatz | Beschreibung |
|---|---|
| Richtig | Der Prozentsatz der Äußerungen, für die Ihr Modell die Absicht richtig vorhergesagt hat. Wenn das Modell für als Nicht relevantmarkierte Äußerungen keine Absicht vorhersagt, wird dieses Ergebnis als Richtig gewertet. |
| Richtig unter mehreren | Für Äußerungen, bei denen mehr als eine Absicht vorhergesagt wurde. Der Prozentsatz der Äußerungen, für die das Modell die Absicht(en) richtig vorhergesagt hat, aber auch Absichten vorhergesagt hat, die nicht zu der Äußerung gehörten. |
| Verfehlt | Der Prozentsatz der Äußerungen, für die Ihr Modell keine Absicht vorhergesagt hat, obwohl eine erwartete Absicht vorhanden war. |
| Falsch | Der Prozentsatz der Äußerungen, für die Ihr Modell eine Absicht vorhergesagt hat, die nicht korrekt war. |
Tests können sich auf den Konfidenzschwellenwert des Modells auswirken. Der Konfidenzschwellenwert bestimmt, wie sicher ein Modell sein muss, um eine Absicht für eine Äußerung vorherzusagen. Weitere Informationen zu Konfidenzschwellenwerten finden Sie unter NLU-Modelleinstellungen.
Informationen zu Äußerungen, bei denen keine Absicht vorhergesagt werden darf, finden Sie unter Erkennung von Irrelevanz in NLU.
Modell veröffentlichen.
Weitere Informationen zum Veröffentlichen von Modellen finden Sie unter Veröffentlichen Sie Ihr Modell NLU ..
Batch-Tests für mehrfache Modelle
In der Phase Modell testen und veröffentlichen testen Sie Ihr Modell anhand des Standardtestsatzes. Mit Batch-Tests für mehrere Modelle können Sie Tests mit anderen Testsätzen durchführen, mehrere Modelle gleichzeitig testen und Ihre Testergebnisse anzeigen. Um Batch-Tests für mehrfache Modelle zu verwenden, navigieren Sie zu .
Weitere Informationen finden Sie unter Batch-Tests für mehrfache Modelle.
Informationen zum Testprozess finden Sie unter Ihr Modell testen.