Aktivieren Sie den Anstößigkeitsschutz für generative KI

Freigeben Version: Australia

Aktualisiert 31. Juli 2025

2 Minuten Lesedauer

Aktivieren Sie die Erkennung von Anstößigkeit, um anstößige Inhalte zu protokollieren oder zu blockieren, die von generiert wurden Now Assist Kompetenzen und Workflows.

Vorbereitungen

Erforderliche Rolle: sn_generative_ai.nsa_admin

Warum und wann dieser Vorgang ausgeführt wird

Die Ausgabe der generativen KI ist probabilistisch, d. h. dieselbe Eingabe kann verschiedene Ausgaben erzeugen. Einige der KI-generierten Inhalte können anstößig sein, z. B. giftige, sexistische oder andere schädliche Sprache. Now Assist Guardian Erkennt anstößige Inhalte sowohl in Eingaben als auch in Ausgaben und protokolliert das Ereignis, wenn es erkannt wird. Sie können es auch so konfigurieren, dass anstößiges Material blockiert wird, damit Anwender anstelle der generierten Antwort eine Standardfehlermeldung sehen.

Hinweis:

Die Erkennung von Anstößigkeit gilt nur für bestimmte Now Assist Kompetenzen und Workflows. Es ist nicht für alle verfügbar Now Assist Anwendungen. Weitere Informationen zur Liste der Kompetenzen, die die Erkennung von Anstößigkeit unterstützen, finden Sie unter Now Assist Guardian .

Sie können Protokolle zur Überprüfung exportieren. Weitere Informationen finden Sie unter Exportieren Sie Now Assist Guardian-Protokolle .

Prozedur

Navigieren zu Alle > Now Assist-Administrator > Einstellungenan.
Wählen Sie im Seitenbereich aus Now Assist Guardian > Anstößigkeit Registerkarte
Wechseln Sie zu Verfügbar für Sie Registerkarte, um anzuzeigen, aus welchen Workflows Sie auswählen können.

Schutzmaßnahmen gegen Anstößigkeit, die bereits aktiviert sind, werden in angezeigt Aktiv Registerkarte.
Wählen Sie Aus Aktivieren Für den Workflow, für den Sie die Erkennung von Anstößigkeit aktivieren möchten.
In Wählen Sie eine Aktion aus, wenn anstößige Inhalte erkannt werden Wählen Sie eine der folgenden Optionen aus.
- Um die Ereignisse aufzuzeichnen, wenn anstößige Inhalte erkannt werden, während der Inhalt für den Anwender sichtbar bleibt, wählen Sie aus Protokollieren Sie die Ausgabe . Der anstößige Inhalt wird dem Anwender weiterhin angezeigt.
- Wählen Sie aus, um das Ereignis aufzuzeichnen und zu verhindern, dass der Inhalt dem Anwender angezeigt wird Blockieren Sie die Antwort, und protokollieren Sie die Ausgabe . Der Anwender sieht stattdessen eine Standardfehlermeldung.
In Wählen Sie den Schweregrad des Inhalts aus, um auf Anstößigkeit zu überprüfen Wählen Sie eine der folgenden Optionen aus.
- Wählen Sie aus, um selbst die geringsten Hinweise auf anstößige Inhalte zu kennzeichnen Niedrig .
- Wählen Sie aus, um klare oder mäßig anstößige Inhalte zu kennzeichnen Mittel .
- Wählen Sie aus, um nur stark anstößige Inhalte zu kennzeichnen Hoch .
Wählen Sie Aus Speichern und aktivieren .
Wählen Sie Speichern.

Ergebnisse

Schutzmaßnahmen zur Erkennung von Anstößigkeit ist in Ihrer Instanz für den ausgewählten Workflow aktiviert. Ereignisse werden protokolliert, wenn anstößige Inhalte erkannt oder generiert werden.

Nächste Maßnahme

Sie können die Erkennung von Anstößigkeit für separat für jede unterstützte aktivieren Now Assist Anwendung und Workflow. Wiederholen Sie diese Aufgabe für jeden Workflow, für den der Anstößigkeitsschutz aktiviert werden soll.

Um die Erkennungsauswirkung für einen aktiven Workflow zu ändern, wählen Sie weitere Optionen aus ( ) Symbol Wählen Sie in der Liste der aktiven Workflows aus, und wählen Sie dann aus Bearbeiten .

Um den Anstößigkeitsschutz für einen Workflow zu deaktivieren, wählen Sie weitere Optionen aus ( ) Symbol in der Liste der aktiven Workflows, und wählen Sie dann aus Deaktivieren .