Now Assist Guardian analytics
Überwachen Sie die Leistung von Schutzmaßnahmen, die über aktiviert wurden Now Assist Guardian.
Die Now Assist Guardian das analytics-Dashboard hilft Administratoren, die Effektivität anstößiger Inhalte und Prompt Injection-Schutzmaßnahmen bei der Nachverfolgung und Analyse von Anforderungen, die an große Sprachmodelle (LLM) gesendet werden, und deren Antworten zu überwachen und zu bewerten.
Die Indikatoren auf Now Assist Guardian Die Dashboard-Seite bietet die folgenden Einblicke.
- Durchschnittliche Latenz als Ergebnis aktiver Schutzmaßnahmen für anstößige Inhalte und Prompt Injection. Eine hohe Latenz kann eine erhöhte Schutzmaßnahme-Aktivität im Zeitraum bedeuten.
- Anzahl und Prozentsatz der anstößigen Inhalte und Prompt Injection-Vorkommen.
- Kompetenzen, bei denen anstößige Inhalte und Prompt Injection-Vorkommen erkannt wurden.
Wenden Sie die Filter auf das Dashboard an, um Schutzmaßnahmen für Kompetenzen in einem Datumsbereich anzuzeigen. Siehe Now Assist Analytics Dashboard-Indikatordetails Für Informationen zu den Daten und Berechnungen hinter jedem Indikator.
Anstößige Inhaltsindikatoren
- Guardrail-bezogene Latenz
- In diesem Bereich des Dashboards wird die durchschnittliche Latenz als Ergebnis der aktiven Schutzmaßnahme für anstößige Inhalte für die ausgewählten Kompetenzen und den Datumsbereich angezeigt.
Abbildung : 2. Von Guardrail hinzugefügter Latenzindikator - Prozentualer Anteil der anstößig gekennzeichneten Inhalte
- In diesem Bereich des Dashboards wird der Prozentsatz der Anforderungen und Antworten an und vom LLM-Service angezeigt, die für anstößige Inhalte gekennzeichnet sind.
Abbildung : 3. Prozentsatz, der als anstößiger Indikator gekennzeichnet ist - Gesamtzahl der Vorkommen von anstößigen Inhalten
- In diesem Bereich des Dashboards wird die Gesamtzahl der anstößigen Inhalte für die ausgewählten Kompetenzen und den Datumsbereich angezeigt.
Abbildung : 4. Indikator für das Vorkommen anstößiger Inhalte insgesamt - Kategorien anstößiger Inhalte
- Dieser Bereich des Dashboards zeigt eine Aufgliederung der anstößigen Inhalte nach Kategorien an. Wenn Inhalte in mehr als einer Kategorie als anstößig gelten, z. B. giftig und diffamierend, wird das Vorkommen einzeln für beide Kategorien gezählt. Weitere Informationen zu anstößigen Inhaltskategorien finden Sie unter .
Abbildung : 5. Kategorien des Indikators für anstößige Inhalte - Vorkommen von anstößigen Inhalten nach Kompetenz
- In diesem Bereich des Dashboards wird die Anzahl der anstößigen Inhalte im Laufe der Zeit nach den Kompetenzen angezeigt, in denen der Inhalt erkannt wird.
Abbildung : 6. Vorkommen anstößiger Inhalte nach Kompetenzindikator
Indikatoren für Prompt Injection
- Guardrail-bezogene Latenz
- In diesem Bereich des Dashboards wird die durchschnittliche Latenz als Ergebnis der aktiven Prompt Injection-Schutzmaßnahme für die ausgewählten Kompetenzen und den Datumsbereich angezeigt.
Abbildung : 7. Von Guardrail hinzugefügter Latenzindikator - Prozentualer Anteil als Prompt Injection gekennzeichnet
- In diesem Bereich des Dashboards wird der Prozentsatz der Anforderungen und Antworten an und vom LLM-Service angezeigt, die für anstößige Inhalte gekennzeichnet sind.
Abbildung : 8. Prozentsatz, der als Indikator für Prompt Injection gekennzeichnet ist - Gesamzahl der Vorkommen von Prompt Injection
- In diesem Bereich des Dashboards wird die Gesamtzahl der anstößigen Inhalte für die ausgewählten Kompetenzen und den Datumsbereich angezeigt.
Abbildung : 9. Indikator für Gesamtzahl der Prompt Injection-Vorkommen - Vorkommen von Prompt Injection nach Kompetenz
- Dieser Bereich des Dashboards zeigt die Anzahl der Aufforderungseinschleusungen im Zeitverlauf nach den Kompetenzen an, bei denen Aufforderungseinschleusungsversuche erkannt wurden.
Abbildung : 10. Prompt Injection-Vorkommen nach Kompetenzindikator