Registerkarte „Integrität“ in KI-Kontrollstelle

  • Freigeben Version: Zurich
  • Aktualisiert 11. August 2025
  • 2 Minuten Lesedauer
  • Überwachen Sie die Leistung von Schutzmaßnahmen, die über aktiviert wurden Now Assist Guardian.

    Die Registerkarte Integrität in KI-Kontrollstelle Mit dem Dashboard können Sie die Effektivität von Schutzmaßnahmen für anstößige Inhalte und Prompt Injection überwachen und bewerten, die für Ihre KI-Assets aktiv sind.

    Abbildung : 1. Registerkarte „Integrität“ in KI-Kontrollstelle
    Registerkarte „Integrität“ mit Metriken für anstößige Inhalte und Schutzmaßnahmen für Prompt Injection
    Die Visualisierungen auf der Registerkarte Integrität bieten die folgenden Einblicke.
    • Durchschnittliche Latenz als Ergebnis aktiver Schutzmaßnahmen für anstößige Inhalte und Prompt Injection. Eine hohe Latenz kann eine erhöhte Schutzmaßnahme-Aktivität im Zeitraum bedeuten.
    • Anzahl und Prozentsatz der anstößigen Inhalte und Prompt Injection-Vorkommen.
    • Kompetenzen, bei denen anstößige Inhalte und Prompt Injection-Vorkommen erkannt wurden.

    Wenden Sie die Filter auf das Dashboard an, um Schutzmaßnahmen für Kompetenzen in einem Datumsbereich anzuzeigen.

    Effektivität der Inhaltsgarantie

    Anzahl der gekennzeichneten Inhaltselemente
    In diesem Bereich des Dashboards wird die Anzahl der anstößigen Inhalte und Prompt Injection-Vorkommen im ausgewählten Datumsbereich angezeigt.
    Abbildung : 2. Anzahl der gekennzeichneten Inhaltselemente
    Visualisierung, die die Gesamtzahl der Inhaltselemente anzeigt, die für Anstößigkeit und Prompt Injection gekennzeichnet sind
    Prozentsatz der Inhaltselemente, die als Gesamtnutzung gekennzeichnet sind
    In diesem Bereich des Dashboards wird der Prozentsatz der Anforderungen und Antworten an und vom LLM-Service (Large Language Model) angezeigt, die für Anstößigkeit und Prompt Injection gekennzeichnet sind.
    Abbildung : 3. Prozentsatz der Inhaltselemente, die als Gesamtnutzung gekennzeichnet sind
    Visualisierung, die den Prozentsatz der Inhaltselemente anzeigt, die aufgrund von Anstößigkeit und Prompt Injection gekennzeichnet sind

    Anstößige Inhaltsvisualisierungen

    Durch Schutzmaßnahmen hinzugefügte Latenz
    In diesem Bereich des Dashboards wird die durchschnittliche Latenz als Ergebnis der aktiven Schutzmaßnahme für anstößige Inhalte für die ausgewählten Kompetenzen und den Datumsbereich angezeigt.
    Abbildung : 4. Durch Schutzmaßnahmen hinzugefügte Latenz für Anstößigkeit
    Schutzlatenz für Schutzmaßnahmen gegen Anstößigkeit
    Prozentsatz als anstößig gekennzeichnet
    In diesem Bereich des Dashboards wird der Prozentsatz der Anforderungen und Antworten an und vom LLM-Service angezeigt, die für anstößige Inhalte gekennzeichnet sind.
    Abbildung : 5. Prozentsatz als anstößig gekennzeichnet
    Prozentsatz der Vorkommen anstößiger Inhalte.
    Gesamtzahl der Vorkommen anstößiger Inhalte
    In diesem Bereich des Dashboards wird die Gesamtzahl der anstößigen Inhalte für die ausgewählten Kompetenzen und den Datumsbereich angezeigt.
    Abbildung : 6. Gesamtzahl der Vorkommen anstößiger Inhalte
    Gesamtzahl der Vorkommen anstößiger Inhalte.
    Kategorien anstößiger Inhalte
    In diesem Bereich des Dashboards wird eine Aufgliederung der anstößigen Inhalte nach Kategorien angezeigt. Wenn Inhalte unter mehr als einer Kategorie als anstößig gelten, z. B. giftig und diffamierend, wird das Vorkommen einzeln für beide Kategorien gezählt. Weitere Informationen zu anstößigen Inhaltskategorien finden Sie unter .
    Abbildung : 7. Kategorien anstößiger Inhalte
    Visualisierung, die Kategorien anstößiger Inhalte anzeigt
    Anstößige Inhaltsvorkommen nach Kompetenz
    In diesem Bereich des Dashboards wird die Anzahl der anstößigen Inhalte im Laufe der Zeit nach den Kompetenzen angezeigt, in denen der Inhalt erkannt wird.
    Abbildung : 8. Anstößige Inhaltsvorkommen nach Kompetenz
    Anstößige Inhaltsvorkommen nach Kompetenz.

    Visualisierungen der Prompt Injection

    Durch Schutzmaßnahmen hinzugefügte Latenz
    In diesem Bereich des Dashboards wird die durchschnittliche Latenz als Ergebnis der aktiven Prompt Injection-Schutzmaßnahme für die ausgewählten Kompetenzen und den Datumsbereich angezeigt.
    Abbildung : 9. Durch Schutzmaßnahmen hinzugefügte Latenz für Prompt Injection
    Visualisierung, die durch Schutzmaßnahmen hinzugefügte Latenz anzeigt
    Prozentsatz, der als Prompt Injection gekennzeichnet ist
    In diesem Bereich des Dashboards wird der Prozentsatz der Anforderungen und Antworten an und vom LLM-Service angezeigt, die für anstößige Inhalte gekennzeichnet sind.
    Abbildung : 10. Prozentsatz, der als Prompt Injection gekennzeichnet ist
    Visualisierung, die den Prozentsatz der Anforderungen und Antworten anzeigt, die als Prompt Injection gekennzeichnet sind.
    Gesamtzahl der Aufforderungseinschleusungen
    In diesem Bereich des Dashboards wird die Gesamtzahl der anstößigen Inhalte für die ausgewählten Kompetenzen und den Datumsbereich angezeigt.
    Abbildung : 11. Gesamtzahl der Aufforderungseinschleusungen
    Gesamtzahl der Aufforderungseinschleusungen
    Prompt Injection-Vorkommen nach Kompetenz
    Dieser Bereich des Dashboards zeigt die Anzahl der Aufforderungseinschleusungen im Zeitverlauf nach den Kompetenzen an, bei denen Aufforderungseinschleusungsversuche erkannt wurden.
    Abbildung : 12. Prompt Injection-Vorkommen nach Kompetenz
    Visualisierung, die Aufforderungseinschleusungen nach Kompetenz anzeigt