エージェント型 AI 資産の評価
初期セットアップから再評価まで、エージェント型評価ライフサイクルのあらゆるステージに関するガイダンスをご覧ください。
エージェント型評価の概要
エージェント型 AI を大規模に評価するには、以下で説明するワークフローに従います。
- 最初の自動評価実行を作成します。
エージェント型評価ホームページと自動評価のガイド付きセットアップについて理解します。
- 進捗状況を追跡および監視します。
進行中の自動評価は、エージェント型 AI のパフォーマンスに関する重要な情報を提供できます。すべての結果が得られる前に、初期の問題を確認します。
- 結果の出力を確認します。
- LLM によって判定されたスコアを参照してください。
- 一貫した問題を特定します。
- 問題をソースまでさかのぼって追跡します。
- 最適化を適用します。
- 他のエージェント型ワークフローまたは AI エージェントの自動評価実行を作成します。
- 特定のビジネスニーズに照らして評価するカスタムメトリクスを作成します。