Untersuchen

Australien aktiviert KI

Release

australia

ft:locale

de-DE

ft:publication_title

Australien aktiviert KI

ft:clusterId

platai

bundleId

platai

workflow

Platform

Agenten-Evaluierungen erkunden

Freigeben Version: Australia

Aktualisiert 18. März 2026

2 Minuten Lesedauer

Automatisierte Evaluierungen testen Ihre Agenten-KI-Assets und helfen zu bestimmen, wann sie für die Produktion bereit sind. Erfahren Sie mehr darüber, wie Evaluierungen funktionieren, für wen sie konzipiert sind und welche Vorteile sie bieten.

Übersicht über Agentische Auswertungen

Automatisierte Agentenauswertungen helfen KI-Agenten-Buildern, sich auf die Bereitstellung zu verlassen, indem sie objektive, erklärbare Beweise dafür liefern, dass ihre Agenten bereit für die Produktion sind. Sie entfernen das Rätselraten aus der Qualitätssicherung, indem Sie Ihren Service Desk-Mitarbeiter anhand eines definierten Datensatzes ausführen und LLM-gestützte Richter auf die Punktzahlqualität anwenden, z. B. Aufgabenvollständigkeit, Antwortgenauigkeit und Toolverwendung. Von dort aus generiert das System empfohlene Optimierungen, die Sie anwenden können, bevor Sie eine erneute Bewertung auslösen, um Verbesserungen zu bestätigen.

Das Erstellen von Agenten-KI-Assets wie KI-Agenten und Agenten-Workflows ist ein iterativer Prozess. Agenten-Evaluierungen sollen die Qualität des KI-Assets strukturiert verifizieren, um den Prozess zu beschleunigen. Da Sie anhand repräsentativer Datensätze testen, können Sie sich mehr auf die Leistung Ihres agentenbasierten KI-Assets verlassen, um reale Situationen zu bewältigen.

Agentenauswertungen können in nicht-Produktionsumgebungen ausgeführt werden und erfordern keine Live-Bereitstellung. Sie können während der Testphasen von Agenten-KI-Assets ausgeführt werden, um sicherzustellen, dass sie in einer Produktionsumgebung bereitgestellt werden können und gleichzeitig Ihre Benchmarks und Standards erfüllen.

Anwender von Agenten-Evaluierungen

Tabelle : 1. Anwender
Anwender	Beschreibung
Agent-Generator	Entwickler oder Konfigurator, der Agenten in erstellt KI-Agenten-Studio. Automatisierte Evaluierungen sind so konzipiert, dass Agent Builder rigorose Evaluierungen im Maßstab ausführen können.
Plattformadministratoren	Plattformadministratoren, die steuern, welche Service Desk-Mitarbeiter für die Produktion genehmigt werden, können automatisierte Evaluierungsergebnisse für Qualitätsnachweise vor der Bereitstellung verwenden.
KI-Leads und Architekten	KI-Leads und -Architekten können automatisierte Evaluierungsergebnisse für Audit-Trails und Qualitätsmetriken für mehrere Agenten verwenden.

Automatisierter Evaluierungs-Workflow

Konfigurieren Sie eine Evaluierungsausführung mit einem Namen, einem ausgewählten Agenten-KI-Asset und seiner Version, Metriken und einem Datensatz.
Führen Sie die Ausführung aus, und verfolgen Sie den Fortschritt, während das LLM Agenten-Antworten bewertet.
Analysieren Sie die Ausführungsergebnisse, einschließlich der Beurteilungspunktzahlen und identifizierter Probleme und Nachverfolgungen.
Optimieren Sie das Agenten-KI-Asset mit gezielten Empfehlungen, und lösen Sie dann Neubewertungen aus.
Validieren Sie die Qualität zukünftiger Ausführungen oder anderer Änderungen am agentenbasierten KI-Asset.

Vorteile automatisierter Evaluierungen

Tabelle : 2. Vorteile automatisierter Evaluierungen
Vorteil	Funktion	Anwender
Bewerten Sie bestimmte Versionen von Agenten-KI-Assets auf Qualität	Führen Sie eine Evaluierungsausführung aus	Agenten-Builder
Legen Sie Ihre eigenen Standards für Antworten und Leistung der Agenten-KI fest	Anwenderdefinierte Metriken	Agent Builder, Plattformadministratoren, KI-Leads und Architekten
Verfolgen Sie Evaluierungen während ihrer Fortschritte	Ergebnisse in Bearbeitung	Agenten-Builder
Identifizieren Sie Probleme, und verfolgen Sie sie zurück zur Quelle	Auswertungsausgaben	Agent Builder, KI-Leads, KI-Architekten
Optimieren Sie agentenbasierte KI-Assets basierend auf Auswertungsergebnissen	Vom System generierte Optimierungsempfehlungen	Agenten-Builder

Empfehlungen für weitere Themen

Weitere Informationen zum Konfigurieren und Verwenden von Agentenauswertungen finden Sie unter: