Registerkarte „Health“ (Integrität)

Zürich – KI aktivieren

Release

zurich

ft:locale

de-DE

ft:publication_title

Zürich – KI aktivieren

ft:clusterId

platai

bundleId

platai

workflow

Platform

Registerkarte „Integrität“ in KI-Kontrollstelle

Freigeben Version: Zurich

Aktualisiert 11. August 2025

2 Minuten Lesedauer

Überwachen Sie die Leistung von Schutzmaßnahmen, die über aktiviert wurden Now Assist Guardian.

Die Registerkarte Integrität in KI-Kontrollstelle Mit dem Dashboard können Sie die Effektivität von Schutzmaßnahmen für anstößige Inhalte und Prompt Injection überwachen und bewerten, die für Ihre KI-Assets aktiv sind.

Registerkarte „Integrität“ mit Metriken für anstößige Inhalte und Schutzmaßnahmen für Prompt Injection — Abbildung : 1. Registerkarte „Integrität“ in KI-Kontrollstelle

Die Visualisierungen auf der Registerkarte Integrität bieten die folgenden Einblicke.

Durchschnittliche Latenz als Ergebnis aktiver Schutzmaßnahmen für anstößige Inhalte und Prompt Injection. Eine hohe Latenz kann eine erhöhte Schutzmaßnahme-Aktivität im Zeitraum bedeuten.
Anzahl und Prozentsatz der anstößigen Inhalte und Prompt Injection-Vorkommen.
Kompetenzen, bei denen anstößige Inhalte und Prompt Injection-Vorkommen erkannt wurden.

Wenden Sie die Filter auf das Dashboard an, um Schutzmaßnahmen für Kompetenzen in einem Datumsbereich anzuzeigen.

Effektivität der Inhaltsgarantie

Anzahl der gekennzeichneten Inhaltselemente: In diesem Bereich des Dashboards wird die Anzahl der anstößigen Inhalte und Prompt Injection-Vorkommen im ausgewählten Datumsbereich angezeigt.

Abbildung : 2. Anzahl der gekennzeichneten Inhaltselemente
Prozentsatz der Inhaltselemente, die als Gesamtnutzung gekennzeichnet sind: In diesem Bereich des Dashboards wird der Prozentsatz der Anforderungen und Antworten an und vom LLM-Service (Large Language Model) angezeigt, die für Anstößigkeit und Prompt Injection gekennzeichnet sind.

Abbildung : 3. Prozentsatz der Inhaltselemente, die als Gesamtnutzung gekennzeichnet sind

Anstößige Inhaltsvisualisierungen

Durch Schutzmaßnahmen hinzugefügte Latenz: In diesem Bereich des Dashboards wird die durchschnittliche Latenz als Ergebnis der aktiven Schutzmaßnahme für anstößige Inhalte für die ausgewählten Kompetenzen und den Datumsbereich angezeigt.

Abbildung : 4. Durch Schutzmaßnahmen hinzugefügte Latenz für Anstößigkeit
Prozentsatz als anstößig gekennzeichnet: In diesem Bereich des Dashboards wird der Prozentsatz der Anforderungen und Antworten an und vom LLM-Service angezeigt, die für anstößige Inhalte gekennzeichnet sind.

Abbildung : 5. Prozentsatz als anstößig gekennzeichnet
Gesamtzahl der Vorkommen anstößiger Inhalte: In diesem Bereich des Dashboards wird die Gesamtzahl der anstößigen Inhalte für die ausgewählten Kompetenzen und den Datumsbereich angezeigt.

Abbildung : 6. Gesamtzahl der Vorkommen anstößiger Inhalte
Kategorien anstößiger Inhalte: In diesem Bereich des Dashboards wird eine Aufgliederung der anstößigen Inhalte nach Kategorien angezeigt. Wenn Inhalte unter mehr als einer Kategorie als anstößig gelten, z. B. giftig und diffamierend, wird das Vorkommen einzeln für beide Kategorien gezählt. Weitere Informationen zu anstößigen Inhaltskategorien finden Sie unter .

Abbildung : 7. Kategorien anstößiger Inhalte
Anstößige Inhaltsvorkommen nach Kompetenz: In diesem Bereich des Dashboards wird die Anzahl der anstößigen Inhalte im Laufe der Zeit nach den Kompetenzen angezeigt, in denen der Inhalt erkannt wird.

Abbildung : 8. Anstößige Inhaltsvorkommen nach Kompetenz

Visualisierungen der Prompt Injection

Durch Schutzmaßnahmen hinzugefügte Latenz: In diesem Bereich des Dashboards wird die durchschnittliche Latenz als Ergebnis der aktiven Prompt Injection-Schutzmaßnahme für die ausgewählten Kompetenzen und den Datumsbereich angezeigt.

Abbildung : 9. Durch Schutzmaßnahmen hinzugefügte Latenz für Prompt Injection
Prozentsatz, der als Prompt Injection gekennzeichnet ist: In diesem Bereich des Dashboards wird der Prozentsatz der Anforderungen und Antworten an und vom LLM-Service angezeigt, die für anstößige Inhalte gekennzeichnet sind.

Abbildung : 10. Prozentsatz, der als Prompt Injection gekennzeichnet ist
Gesamtzahl der Aufforderungseinschleusungen: In diesem Bereich des Dashboards wird die Gesamtzahl der anstößigen Inhalte für die ausgewählten Kompetenzen und den Datumsbereich angezeigt.

Abbildung : 11. Gesamtzahl der Aufforderungseinschleusungen
Prompt Injection-Vorkommen nach Kompetenz: Dieser Bereich des Dashboards zeigt die Anzahl der Aufforderungseinschleusungen im Zeitverlauf nach den Kompetenzen an, bei denen Aufforderungseinschleusungsversuche erkannt wurden.

Abbildung : 12. Prompt Injection-Vorkommen nach Kompetenz