Führen Sie eine Ausführung aus

Australien aktiviert KI

Release

australia

ft:locale

de-DE

ft:publication_title

Australien aktiviert KI

ft:clusterId

platai

bundleId

platai

workflow

Platform

Führen Sie eine Agenten-Evaluierungsausführung aus

Freigeben Version: Australia

Aktualisiert 13. November 2025

4 Minuten Lesedauer

Bewerten Sie Agenten-KI-Assets anhand von Datensätzen, um die Leistung zu überwachen und Benchmarks zu vergleichen.

Vorbereitungen

Evaluierungsausführungen erfordern Ausführungsprotokolldaten des Agenten-KI-Assets, das Sie auswerten möchten. Sie können Ausführungsprotokolldaten erstellen, indem Sie in testen KI-Agenten-Studio Oder löst agentenbasierte KI in aus Now Assist. Sie können auch Ausführungsprotokolldaten erstellen, nachdem Sie Ihre Evaluierungsausführung eingerichtet haben.

Weitere Informationen zum Testen von agentischen Workflows finden Sie unter Testen Sie die Ausführung eines Agenten-Workflows manuell.

Weitere Informationen zu den ersten Schritten mit agentischen Auswertungen finden Sie unter Allgemeine Richtlinien für agentische Auswertungsausführungen .

Erforderliche Rolle: sn_aia.admin

Prozedur

Navigieren zu Alle > Now Assist-Kompetenzkit > Agentenbasierte Evaluierungenan.

Sie können auch auf der Testseite von beginnen KI-Agenten-Studio. Navigieren zu Alle > KI-Agenten-Studio > Testsan. Wählen Sie Aus Automatisierte Evaluierung starten Um auf das geführte Setup zuzugreifen.
Wählen Sie auf der Homepage der Auswertungen die Option aus Neue Auswertungsausführung Um mit dem geführten Setup zu beginnen.
In Fügen Sie allgemeine Informationen hinzu Schritt: Fügen Sie einen Namen hinzu, und wählen Sie das Agenten-KI-Asset aus, das Sie auswerten möchten.
Wählen Sie Aus Fahren Sie Fort Um zum nächsten Schritt zu wechseln.
Jedes Mal, wenn Sie durch einen Schritt navigieren, wird die Auswertungsausführung automatisch als Entwurf gespeichert. Sie können jederzeit auswählen Als Entwurf speichern .

Wenn Sie das geführte Setup beenden möchten, können Sie auswählen Setup beenden . Sie werden zur Seite „Agentenbewertungen“ weitergeleitet.
- Wenn Sie auswählen Speichern und beenden , Die Evaluierungsausführung wird auf der Seite „Agentenauswertungen“ mit dem Status angezeigt Draft.
- Wenn Sie auswählen Verwerfen und beenden , Der Entwurf der Auswertungsausführung wird gelöscht.
Wählen Sie Ihre Evaluierungsmetrik aus.

Die Bewertung der Vollständigkeit der Gesamtaufgabe ist standardmäßig ausgewählt. Die Ausführung mehrerer Evaluierungsmetriken bietet einen umfassenden Überblick über die Leistung des Agenten-KI-Assets.

Um weitere Informationen zu jedem Plan anzuzeigen, können Sie die Karte für jeden Evaluierungsplan erweitern, indem Sie das Chevron-Symbol auswählen .

Alle anwenderdefinierten Metriken, die Sie veröffentlicht haben, werden als Optionen angezeigt. Wenn Ihre anwenderdefinierte Metrik nicht angezeigt wird, überprüfen Sie, ob sie veröffentlicht wurde. Siehe Erstellen Sie eine anwenderdefinierte Metrik Weitere Informationen finden Sie unter .

Hinweis:
Die Richtigkeitsmetrik des Toolaufrufs ist für KI-Sprachagenten nicht verfügbar.

Konfigurieren Sie Ihren Datensatz.

Wählen Sie zwischen der Generierung neuer Ausführungsprotokolle durch Ausführen des Agenten oder Workflows oder mithilfe von Ausführungsprotokollen aus vorherigen Ausführungen.

Hinweis:
Wenn Sie KI-Sprachagenten auswerten, müssen Sie vorhandene Ausführungsprotokolle verwenden.

Um einen Datensatz durch Generieren neuer Ausführungsprotokolle zu erstellen, wählen Sie zunächst eine Tabelle aus.

Anstatt einen neuen Datensatz von Grund auf neu zu erstellen, können Sie einen früheren Datensatz verwenden, den Sie in einer anderen Auswertung verwendet haben, indem Sie auswählen Wählen Sie aus einem früheren Datensatz aus . Sobald Sie einen Datensatz ausgewählt haben, können Sie die Details überprüfen, einschließlich Quelltabelle, Datensatzanzahl und das letzte Agenten-KI-Asset, das den Datensatz verwendet hat.

Hinweis:

Wenn Sie ein agentenbasiertes KI-Asset auswerten, das mit dem KI-Agenten-Berater erstellt wurde, werden die Optionen für Ihren Datensatz automatisch für Sie ausgefüllt. Sie können die Werte weiterhin bearbeiten.

Tabelle : 1. Konfigurieren Sie das Datensatzformular für neue Ausführungsprotokolle
Feldname	Beschreibung
Tabelle	Die Quelltabelle für Datensätze, die das Agenten-KI-Asset zum Ausführen von Aufgaben und Erstellen von Ausführungen verwendet.
Filter hinzugefügt	Bedingungen zum Eingrenzen der Liste der Datensätze für das agentenbasierte KI-Asset, das zum Generieren von Ausführungsprotokolldaten verwendet werden soll.
Anzahl der zu verwendenden Datensätze	Die maximale Anzahl von Datensätzen innerhalb des Datensatzes zur Auswertung. Wenn der Datensatz mehr Datensätze als das Maximum enthält, werden zusätzliche Datensätze ignoriert.
Aufgabe	Äußerung an das auszuführende Agenten-KI-Asset. Verwenden Sie die Pillenauswahl, um dynamische Eingaben für die Aufgabe auszuwählen. Legen Sie beispielsweise die Startanweisung auf fest `Helfen Sie mir, {{Incident.number}} zu lösen` . Eingaben aus dem Datensatz müssen zwischen doppelten geschweiften Klammern geschrieben werden.
Zusätzliche Details zum Agent oder Workflow	Informationen, die dem Large Language Model (LLM) gegeben werden und die Informationen zum Tabellendatensatz ergänzen. Beispielsweise erfordert ein agentenbasierter Workflow für die Erstattung von Schulungskosten den normalen Erstattungszuschuss, der über einen wissensartikel bereitgestellt werden kann.
Als Anwender ausführen	Der Anwender, der dem Tabellendatensatz zugeordnet ist, um das Agenten-KI-Asset auszuführen. Je nach Anwendungsfall können Sie den Anwender beispielsweise als anfordernde Person oder als Erfüller ausführen.
Name	Name für den Datensatz. Dies kann nützlich sein, wenn Sie denselben Datensatz erneut verwenden möchten.
Beschreibung	Beschreibung der Datensätze, die im Datensatz enthalten sind. Dies kann nützlich sein, wenn Sie denselben Datensatz erneut verwenden möchten.

Hinweis:

Wenn Sie neue Ausführungsprotokolle erstellen, muss der Anwender, der die Auswertung übermittelt, die ACLs des Agenten-KI-Assets und seiner Komponenten übergeben. Ohne richtige Rollenanforderungen melden Ausführungsprotokolle Zugriffsverweigerungen, und die Auswertung schlägt fehl. Siehe Sicherheit für agentenbasierte KI Für weitere Informationen.

Neue Ausführungsprotokolle generieren ausgewählt. Beispieldatensätze haben einen Status- und Prioritätsfilter angewendet

Weitere Optionen zum Generieren neuer Ausführungsprotokolle, einschließlich der Anzahl der zu verwendenden Datensätze, der Aufgabe, zusätzlicher Details zum Agent oder Workflow und der Ausführung als Anwender

Tabelle : 2. Konfigurieren Sie das Datensatzformular für vorhandene Ausführungsprotokolle
Feldname	Beschreibung
Filter hinzugefügt	Bedingungen für die Einengung der KI-Ausführungsprotokolldatensätze, die Sie in den Datensatz aufnehmen möchten. Hinweis: Filterbedingungen werden für die Erstellung von Datensätzen von Ausführungsprotokollen des KI-Sprachagenten nicht unterstützt.
Anzahl der zu verwendenden Datensätze	Die maximale Anzahl von Datensätzen innerhalb des Datensatzes zur Auswertung. Wenn der Datensatz mehr Datensätze als das Maximum enthält, werden zusätzliche Datensätze ignoriert.

Wählen Sie Aus Siehe Vorschau Um eine Liste von Datensätzen basierend auf den von Ihnen angegebenen Bedingungen anzuzeigen.
Sie können die Datensätze eingrenzen, indem Sie bestimmte Datensätze in der Vorschauliste auswählen. Nicht ausgewählte Datensätze werden nicht in den Datensatz aufgenommen.

Überprüfen Sie die Details der agentischen Bewertung im letzten Schritt des geführten Setups.

Wenn Sie Änderungen vornehmen möchten, können Sie auswählen Zurück Um zu einem vorherigen Schritt zu wechseln, oder Sie können den Schritt in der Sidebar auswählen.
Wählen Sie Aus Bewertung starten .

Ergebnisse

Ihre Auswertungsausführung wird ausgeführt. Die Abschlusszeit variiert, aber nach Abschluss können Sie die Auswertung auf der Seite „Agentenbewertungen“ auswählen, um Ergebnisse anzuzeigen.

Weitere Informationen zu den Metriken auf der Ergebnisseite finden Sie unter Ergebnisse der Ausführung der Agentischen Auswertung .