の [健全性] タブ AI コントロールタワー

  • リリースバージョン: Zurich
  • 更新日 2025年08月11日
  • 所要時間:3分
  • Now Assist ガーディアンによって有効化されたガードレールのパフォーマンスを監視します。

    AI コントロールタワーダッシュボードの [健全性] タブは、不快なコンテンツの有効性を監視および評価し、AI 資産でアクティブなプロンプトインジェクションガードレールを有効にするのに役立ちます。

    図 : 1. の [健全性] タブ AI コントロールタワー
    不快なコンテンツとプロンプトインジェクションガードレールのメトリクスを表示する [健全性] タブ
    [健全性] タブの可視化により、次のインサイトが得られます。
    • アクティブな不快なコンテンツとプロンプトインジェクションガードレールの結果としての平均レイテンシ。レイテンシーが高いということは、期間中のガードレール活動の増加を意味する可能性があります。
    • 不快なコンテンツとプロンプトインジェクションの発生回数と割合。
    • 不快なコンテンツとプロンプトインジェクションの発生が検出されたスキル。

    ダッシュボードのフィルターを適用して、日付範囲内のスキルのガードレールアクティビティを表示します。

    コンテンツガードレールの有効性

    フラグ付けされたコンテンツアイテムの数
    ダッシュボードのこの領域には、選択した日付範囲内に不快なコンテンツとプロンプトインジェクションが発生した回数が表示されます。
    図 : 2. フラグ付けされたコンテンツアイテムの数
    攻撃性とプロンプトインジェクションのフラグが立てられたコンテンツアイテムの合計数を示す可視化
    合計使用量のうちフラグが立てられたコンテンツアイテムの割合
    ダッシュボードのこの領域には、大規模言語モデル (LLM) サービスとの間で送受信された要求と応答のうち、攻撃性とプロンプトインジェクションのフラグが付けられたものの割合が表示されます。
    図 : 3. 合計使用量のうちフラグが立てられたコンテンツアイテムの割合
    攻撃性とプロンプトインジェクションのフラグが立てられたコンテンツアイテムの割合を示す可視化

    不快なコンテンツの可視化

    ガードレールによって遅延が加わる
    ダッシュボードのこの領域には、選択したスキルと日付範囲における、アクティブな不快なコンテンツガードレールの結果としての平均レイテンシが表示されます。
    図 : 4. ガードレールによって追加された攻撃性のレイテンシ
    攻撃性ガードレールのガードレールレイテンシ
    不快としてフラグが立てられた割合
    ダッシュボードのこの領域には、不快なコンテンツとしてフラグが立てられた、LLM サービスとの間で送受信された要求と応答の割合が表示されます。
    図 : 5. 不快としてフラグが立てられた割合
    不快なコンテンツの発生率。
    不快なコンテンツの合計発生件数
    ダッシュボードのこの領域には、選択したスキルと日付範囲で不快なコンテンツが発生した合計回数が表示されます。
    図 : 6. 不快なコンテンツの合計発生件数
    不快なコンテンツの合計発生件数。
    不快なコンテンツのカテゴリ
    ダッシュボードのこの領域には、不快なコンテンツの発生の内訳がカテゴリ別に表示されます。コンテンツが複数のカテゴリで攻撃的であると見なされた場合(有害で中傷的など)、その発生は両方のカテゴリに個別にカウントされます。不快なコンテンツのカテゴリの詳細については、「 」を参照してください。
    図 : 7. 不快なコンテンツのカテゴリ
    不快なコンテンツのカテゴリを示す可視化
    スキル別の不快なコンテンツの発生件数
    ダッシュボードのこの領域には、コンテンツが検出されたスキル別の経時的な不快なコンテンツの発生回数が表示されます。
    図 : 8. スキル別の不快なコンテンツの発生件数
    スキル別の不快なコンテンツの発生。

    プロンプトインジェクションの可視化

    ガードレールによって遅延が加わる
    ダッシュボードのこの領域には、選択したスキルと日付範囲のアクティブなプロンプトインジェクションガードレールの結果としての平均レイテンシが表示されます。
    図 : 9. プロンプトインジェクションのガードレールによる遅延の追加
    ガードレールによって遅延が追加されたことを示す可視化
    プロンプトインジェクションとしてフラグが付けられた割合
    ダッシュボードのこの領域には、不快なコンテンツとしてフラグが立てられた、LLM サービスとの間で送受信された要求と応答の割合が表示されます。
    図 : 10. プロンプトインジェクションとしてフラグが付けられた割合
    プロンプトインジェクションとしてフラグが付けられた要求と応答の割合を示す可視化。
    プロンプトインジェクション合計発生件数
    ダッシュボードのこの領域には、選択したスキルと日付範囲で不快なコンテンツが発生した合計回数が表示されます。
    図 : 11. プロンプトインジェクション合計発生件数
    プロンプトインジェクション合計発生件数
    スキル別のプロンプトインジェクション発生件数
    ダッシュボードのこの領域には、プロンプトインジェクションの試行が検出されたスキル別の経時的なプロンプトインジェクションの発生回数が表示されます。
    図 : 12. スキル別のプロンプトインジェクション発生件数
    スキル別のプロンプトインジェクション発生を示す可視化