Ergebnisseite ausführen

Australien aktiviert KI

Release

australia

ft:locale

de-DE

ft:publication_title

Australien aktiviert KI

ft:clusterId

platai

bundleId

platai

workflow

Platform

Ergebnisse der Ausführung der Agentischen Auswertung

Freigeben Version: Australia

Aktualisiert 25. März 2026

3 Minuten Lesedauer

Erfahren Sie auf der Seite mit Ergebnissen der agentischen Bewertung mehr über die Ausführung von Analysen und die Bedeutung verschiedener Auswertungspunktzahlen.

Übersicht über Agentische Auswertungen

Agentenauswertungen messen, wie gut KI-Agenten und Agenten-Workflows ihre Ziele erreichen. Ein Now LLM-Servicemodell beurteilt den KI-Agenten oder Agenten-Workflow basierend auf den Ausführungsprotokollen. Auf der Ergebnisseite einer Auswertungsausführung werden mehrere Metriken und Punktzahlen angezeigt, die die Vollständigkeit der Aufgabe und die Verwendung des Tools messen.

Wenn Sie eine allgemeine Bewertung des Aufgabenabschlusses ausführen, werden auf der Ergebnisseite empfohlene Aktionen für den KI-Agenten oder Agenten-Workflow angezeigt. Empfohlene Aktionen enthalten Vorschläge für die Bereitstellung oder Verbesserung, um sicherzustellen, dass die von Ihnen bereitgestellten Agenten-Workflows Ihren Standards entsprechen.

Nachdem Sie Ihre Evaluierungsergebnisse überprüft haben, können Sie Ihre Evaluierung archivieren oder kopieren, um eine weitere Evaluierung mit denselben Parametern und Datensätzen auszuführen.

Sie können die Auswertungsergebnisse als Bericht exportieren. Der Bericht ist als CSV-Datei formatiert, die die einzelnen sys_IDs der Ausführungsdatensätze und die Metrikpunktzahlen für jeden enthält.

Weitere Informationen zur Nutzung von KI-Agents und anderen Analytics finden Sie unter KI-Agent Analytics-Dashboard In KI-Agenten-Studio.

Übersicht über Auswertungsergebnisse

Für jede von Ihnen ausgeführte Auswertungsmethode wird auf der Ergebnisseite eine Gesamtpunktzahl für den agentischen Workflow mit einem Prozentsatz der erfolgreichen Datensatzauswertungen und der Bezeichnung ausgezeichnet, gut, Mittel oder schlecht angezeigt. Sie können die Metrikschwellenwerte für jede Bezeichnung ändern, indem Sie auswählen Passen Sie Metrikschwellenwerte an .

Zusätzlich zu den Ergebnissen der allgemeinen Aufgabenvollständigkeit können Sie eine Zusammenfassung der Ergebnisse der anderen Metriken überprüfen.

Tabelle : 1. Ergebnisse der Ausführung der Gesamtaufgabe-Vollständigkeitsbewertung
Bezeichnung	Beschreibung	Empfohlene Aktion	Standardschwellenwert
Ausgezeichnet	Aufgaben wurden einheitlich auf einem hohen Standard ausgeführt. Der Agenten-Workflow oder KI-Agent funktioniert gut.	Fahren Sie mit Vertrauen fort	90%–100%
Gut	Die meisten Aufgaben wurden erfolgreich ausgeführt, aber einige Leistungsinkonsistenzen weisen auf Bereiche mit Verbesserungspotenzial hin.	Mit Vorsicht bereitstellen	70%–89%
Mittel	Eine beträchtliche Anzahl von Aufgaben wurde nicht vollständig abgeschlossen. Die Leistung liegt unter dem gewünschten Niveau.	Untersuchen Sie die Ursachen für einen schlechten Aufgabenabschluss	50%–69%
Mangelhaft	Der agentische Workflow führt Aufgaben durchweg nicht ordnungsgemäß ab. Schwerwiegende Probleme sind vorhanden.	Nicht bereitstellen	0 %–49 %

Metrikpunktzahlen für einzelne Datensätze

Auswertungen werden für die Protokolltabellen von agentischen Workflow-Ausführungen ausgeführt. Jeder Datensatz wird für jeden ausgeführten Auswertungsplan einzeln bewertet. Einzelne Datensatzauswertungen werden gemäß den folgenden Metriken bewertet.

Tabelle : 2. Metrikpunktzahlen für Gesamtaufgaben-VollständigkeitsdatensatzDie Metrik für die Vollständigkeit der Gesamtaufgabe bewertet, ob ein KI-Agent seine zugewiesene Aufgabe erfolgreich abschließt. Es wertet die Ausführungsprotokolle des Service Desk-Mitarbeiters aus und stellt sicher, dass alle erforderlichen Schritte ausgeführt wurden und die Aufgabe logisch und effektiv abgeschlossen wurde.
Anzahl	Punktzahl	Beschreibung
3	Erfolgreich	Die Hauptaufgabe wurde vollständig abgeschlossen. Alle Teilaufgaben wurden gelöst, und die Schritte folgten einer logischen Sequenz ohne kritische Fehler.
2	Teilweise erfolgreich	Die Aufgabe wurde teilweise abgeschlossen. Einige Teilaufgaben bleiben ungelöst, oder Ineffizienzen haben sich auf den Prozess ausgewirkt.
1	Nicht erfolgreich	Die Aufgabe wurde nicht abgeschlossen. Kritische Teilaufgaben wurden verworfen oder ungelöst, oder die Ausführung ist vollständig fehlgeschlagen.

Tabelle : 3. Metrikpunktzahlen des ToolleistungsdatensatzesDie Bewertungsmetrik für die Toolleistung bewertet die Fähigkeit eines KI-Agenten, beim Abschließen einer Aufgabe das am besten geeignete Tool für jeden Schritt auszuwählen.
Nummer	Punktzahl	Beschreibung
1	Wahr	Das richtige Tool wurde für die Aktion im Plan ausgewählt.
0	Falsch	Das richtige Tool wurde nicht ausgewählt.

Tabelle : 4. Metrikpunktzahlen für ToolaufrufdatensätzeDie Bewertungsmetrik des Toolaufrufs bewertet, ob ein KI-Agent Toolaufrufe korrekt erstellt, indem die Genauigkeit, Vollständigkeit und Formatierung der bereitgestellten Eingaben validiert wird.
Anzahl	Punktzahl	Beschreibung
1	Wahr	Vollständigkeit des Eingabeschlusses, Richtigkeit des Eingabewerts und Richtigkeit des Eingabeformats sind alle erfolgreich. Input key completeness: 1 – wahr: Alle erforderlichen Parameter sind mit genauen Namensübereinstimmungen vorhanden, und es sind keine unerwarteten Parameter enthalten. Input value correctness: 1 – wahr – Tooleingabewerte sind korrekt zugeordnet. Input format correctness: 1 – wahr – Tooleingaben haben das richtige Format.
0	Falsch	Mindestens eine Vollständigkeit des Eingabeschlusses, der Vollständigkeit des Eingabewerts oder der Vollständigkeit des Eingabeformats war nicht erfolgreich. Input key completeness: 0 – falsch: Ein obligatorischer Parameter fehlt entweder, sein Name stimmt nicht genau überein, oder ein unerwarteter Parameter wurde gefunden. Input value correctness: 0 – falsch – Tooleingabewerte sind nicht korrekt zugeordnet. Input format correctness: 0 – falsch – Tooleingaben haben nicht das richtige Format.

Hinweis:

Die Werte der Untermetriken werden mit einem UND-Operator zusammengefasst. Wenn ein Wert 0 ist, ist die Metrikpunktzahl der gesamten Toolaufrufdatensätze 0.