Bewerten Sie einen agentischen Workflow

Zürich – KI aktivieren

Release

zurich

ft:locale

de-DE

ft:publication_title

Zürich – KI aktivieren

ft:clusterId

platai

bundleId

platai

workflow

Platform

Bewerten Sie einen agentischen Workflow

Freigeben Version: Zurich

Aktualisiert 31. Juli 2025

3 Minuten Lesedauer

Bewerten Sie einen agentischen Workflow anhand eines Datensatzes Ihrer Wahl, um die Leistung zu überwachen und anhand verschiedener Benchmarks zu bewerten.

Vorbereitungen

Auswertungsausführungen erfordern Ausführungsprotokolldaten des agentischen Workflows, den Sie auswerten möchten. Für einen neuen agentischen Workflow können Sie Ausführungsprotokolle erstellen, indem Sie in testen KI-Agenten-Studio. Weitere Informationen zum Testen von agentischen Workflows finden Sie unter Testen Sie einen agentischen Workflow.

Weitere Informationen zu den ersten Schritten mit agentischen Auswertungen finden Sie unter Allgemeine Richtlinien für agentische Auswertungsausführungen .

Erforderliche Rolle: sn_aia.admin

Prozedur

Navigieren zu Alle > Now Assist-Kompetenzkit > Agentenbasierte Evaluierungenan.

Sie können auch auf der Testseite von beginnen KI-Agenten-Studio. Navigieren zu Alle > KI-Agenten-Studio > Testsan. Wählen Sie einen agentischen Workflow aus, und wählen Sie dann aus Richten Sie die Auswertungsausführung ein . Ein Modal wird angezeigt, um zu fragen, ob Sie weitergeleitet werden möchten Now Assist Kompetenzkit. Wählen Sie Aus Öffnen Sie Das Kompetenzkit . Sie werden zu weitergeleitet Geführtes Setup.
Wählen Sie auf der Homepage der Auswertungen die Option aus Neue Auswertungsausführung Um mit dem geführten Setup zu beginnen.
Fügen Sie im Schritt „Allgemeine Informationen hinzufügen“ einen Namen hinzu, und wählen Sie den agentischen Workflow aus, den Sie bewerten möchten.
Wählen Sie Aus Fahren Sie Fort Um zum nächsten Schritt zu wechseln.
Jedes Mal, wenn Sie durch einen Schritt navigieren, wird die Auswertungsausführung automatisch als Entwurf gespeichert. Sie können jederzeit auswählen Als Entwurf speichern .

Wenn Sie das geführte Setup beenden möchten, können Sie auswählen Setup beenden . Sie werden zur Seite „Agentische Auswertungen“ weitergeleitet.
- Wenn Sie auswählen Speichern und beenden , Die Auswertungsausführung wird in der Liste auf der Seite „Agentische Auswertungen“ mit dem Status angezeigt Draft.
- Wenn Sie auswählen Verwerfen und beenden , Der Entwurf der Auswertungsausführung wird gelöscht.
Wählen Sie Ihre Auswertungsmethode aus.

Die Bewertung der Vollständigkeit der Gesamtaufgabe ist standardmäßig ausgewählt. Wenn Sie mehrere Bewertungsmethoden gleichzeitig ausführen, kann dies dazu beitragen, einen umfassenderen Überblick über die Leistung des agentischen Workflows zu erhalten.

Um weitere Informationen zu jedem Plan anzuzeigen, können Sie die Karte für jeden Auswertungsplan erweitern, indem Sie das Chevron-Symbol ( ).

Alle anwenderdefinierten Metriken, die Sie veröffentlicht haben, werden auch als Optionen angezeigt. Wenn Ihre anwenderdefinierte Metrik nicht angezeigt wird, stellen Sie sicher, dass sie veröffentlicht ist. Siehe Erstellen Sie eine anwenderdefinierte Metrik Weitere Informationen finden Sie unter .

Wählen Sie Ihren Datensatz aus.

Wählen Sie einen vorhandenen Datensatz aus, oder erstellen Sie einen eigenen.

Füllen Sie das Formular aus, um einen neuen Datensatz zu erstellen.

Tabelle : 1. Wählen Sie ein Datensatzformular aus
Feldname	Beschreibung
Name	Name des Datensatzes.
Beschreibung	Allgemeine Beschreibung des Datensatzes und seines beabsichtigten Zwecks.
Max. Datensätze (optional)	Die maximale Anzahl von Datensätzen innerhalb des Datensatzes, für die Sie die Auswertung ausführen möchten. Wenn der Datensatz mehr Datensätze enthält als die maximale Anzahl von Datensätzen, werden alle Datensätze nach der maximalen Anzahl von Datensätzen für diese Auswertungsausführung ignoriert.
Filter	Bedingungen für die Einengung der KI-Ausführungsprotokolldatensätze, die Sie in den Datensatz aufnehmen möchten. Standardmäßig ist der von Ihnen ausgewertete agentische Workflow als Filterbedingung ausgewählt.

Kategorisieren Sie den Datensatz „Agentic Evaluation“ für Incidents ohne maximale Anzahl von Datensätzen, und ein Filter für das Feld „Anwendungsfall“ ist „Incident kategorisieren“.

Wählen Sie Aus Siehe Vorschau Um eine Liste von Datensätzen basierend auf den von Ihnen angegebenen Bedingungen anzuzeigen.
Sie können die Datensätze weiter eingrenzen, indem Sie nur einige der Datensätze in der Vorschauliste auswählen. Nicht ausgewählte Datensätze werden nicht in den Datensatz aufgenommen.

Überprüfen Sie die Details der agentischen Bewertung im letzten Schritt des geführten Setups.

Wenn Sie einen Ort bemerken, an dem Sie Änderungen vornehmen möchten, können Sie auswählen Zurück Um zu einem vorherigen Schritt zu wechseln, oder Sie können den Schritt in der Sidebar auswählen.
Wählen Sie Aus Bewertung starten .

Ergebnisse

Ihre Auswertungsausführung wird ausgeführt. Die Zeit, die für den Abschluss einer Auswertungsausführung benötigt wird, variiert. Sobald sie abgeschlossen ist, können Sie die Auswertung auf der Seite „Agentische Auswertungen“ auswählen, um die Ergebnisse anzuzeigen.

Weitere Informationen zu den Metriken auf der Ergebnisseite finden Sie unter Ergebnisse der Ausführung der Agentischen Auswertung .