Registerkarte „Integrität“ in KI-Kontrollstelle
Überwachen Sie die Leistung von Schutzmaßnahmen, die über aktiviert wurden Now Assist Guardian.
Die Registerkarte Integrität in KI-Kontrollstelle Mit dem Dashboard können Sie die Effektivität von Schutzmaßnahmen für anstößige Inhalte und Prompt Injection überwachen und bewerten, die für Ihre KI-Assets aktiv sind.
Die Visualisierungen auf der Registerkarte Integrität bieten die folgenden Einblicke.
- Durchschnittliche Latenz als Ergebnis aktiver Schutzmaßnahmen für anstößige Inhalte und Prompt Injection. Eine hohe Latenz kann eine erhöhte Schutzmaßnahme-Aktivität im Zeitraum bedeuten.
- Anzahl und Prozentsatz der anstößigen Inhalte und Prompt Injection-Vorkommen.
- Kompetenzen, bei denen anstößige Inhalte und Prompt Injection-Vorkommen erkannt wurden.
Wenden Sie die Filter auf das Dashboard an, um Schutzmaßnahmen für Kompetenzen in einem Datumsbereich anzuzeigen.
Effektivität der Inhaltsgarantie
- Anzahl der gekennzeichneten Inhaltselemente
- In diesem Bereich des Dashboards wird die Anzahl der anstößigen Inhalte und Prompt Injection-Vorkommen im ausgewählten Datumsbereich angezeigt.
Abbildung : 2. Anzahl der gekennzeichneten Inhaltselemente - Prozentsatz der Inhaltselemente, die als Gesamtnutzung gekennzeichnet sind
- In diesem Bereich des Dashboards wird der Prozentsatz der Anforderungen und Antworten an und vom LLM-Service (Large Language Model) angezeigt, die für Anstößigkeit und Prompt Injection gekennzeichnet sind.
Abbildung : 3. Prozentsatz der Inhaltselemente, die als Gesamtnutzung gekennzeichnet sind
Anstößige Inhaltsvisualisierungen
- Durch Schutzmaßnahmen hinzugefügte Latenz
- In diesem Bereich des Dashboards wird die durchschnittliche Latenz als Ergebnis der aktiven Schutzmaßnahme für anstößige Inhalte für die ausgewählten Kompetenzen und den Datumsbereich angezeigt.
Abbildung : 4. Durch Schutzmaßnahmen hinzugefügte Latenz für Anstößigkeit - Prozentsatz als anstößig gekennzeichnet
- In diesem Bereich des Dashboards wird der Prozentsatz der Anforderungen und Antworten an und vom LLM-Service angezeigt, die für anstößige Inhalte gekennzeichnet sind.
Abbildung : 5. Prozentsatz als anstößig gekennzeichnet - Gesamtzahl der Vorkommen anstößiger Inhalte
- In diesem Bereich des Dashboards wird die Gesamtzahl der anstößigen Inhalte für die ausgewählten Kompetenzen und den Datumsbereich angezeigt.
Abbildung : 6. Gesamtzahl der Vorkommen anstößiger Inhalte - Kategorien anstößiger Inhalte
- In diesem Bereich des Dashboards wird eine Aufgliederung der anstößigen Inhalte nach Kategorien angezeigt. Wenn Inhalte unter mehr als einer Kategorie als anstößig gelten, z. B. giftig und diffamierend, wird das Vorkommen einzeln für beide Kategorien gezählt. Weitere Informationen zu anstößigen Inhaltskategorien finden Sie unter .
Abbildung : 7. Kategorien anstößiger Inhalte - Anstößige Inhaltsvorkommen nach Kompetenz
- In diesem Bereich des Dashboards wird die Anzahl der anstößigen Inhalte im Laufe der Zeit nach den Kompetenzen angezeigt, in denen der Inhalt erkannt wird.
Abbildung : 8. Anstößige Inhaltsvorkommen nach Kompetenz
Visualisierungen der Prompt Injection
- Durch Schutzmaßnahmen hinzugefügte Latenz
- In diesem Bereich des Dashboards wird die durchschnittliche Latenz als Ergebnis der aktiven Prompt Injection-Schutzmaßnahme für die ausgewählten Kompetenzen und den Datumsbereich angezeigt.
Abbildung : 9. Durch Schutzmaßnahmen hinzugefügte Latenz für Prompt Injection - Prozentsatz, der als Prompt Injection gekennzeichnet ist
- In diesem Bereich des Dashboards wird der Prozentsatz der Anforderungen und Antworten an und vom LLM-Service angezeigt, die für anstößige Inhalte gekennzeichnet sind.
Abbildung : 10. Prozentsatz, der als Prompt Injection gekennzeichnet ist - Gesamtzahl der Aufforderungseinschleusungen
- In diesem Bereich des Dashboards wird die Gesamtzahl der anstößigen Inhalte für die ausgewählten Kompetenzen und den Datumsbereich angezeigt.
Abbildung : 11. Gesamtzahl der Aufforderungseinschleusungen - Prompt Injection-Vorkommen nach Kompetenz
- Dieser Bereich des Dashboards zeigt die Anzahl der Aufforderungseinschleusungen im Zeitverlauf nach den Kompetenzen an, bei denen Aufforderungseinschleusungsversuche erkannt wurden.
Abbildung : 12. Prompt Injection-Vorkommen nach Kompetenz