Ative a detecção de ofensividade para registrar ou bloquear conteúdo ofensivo gerado por Now Assist habilidades e fluxos de trabalho.
Antes de Iniciar
Função necessária: sn_generative_ai.nsa_admin
Por Que e Quando Desempenhar Esta Tarefa
A saída da IA generativa é probabilística, o que significa que a mesma entrada pode produzir saídas diferentes. Parte do conteúdo gerado por IA pode ser ofensivo, o que inclui linguagem tóxica, sexista ou outra linguagem prejudicial.
Guardião do Now Assist detecta conteúdo ofensivo em entradas e saídas e registra o evento quando ele é detectado. Você também pode configurá-lo para bloquear material ofensivo para que os usuários vejam uma mensagem de erro padrão em vez da resposta gerada.
Nota: A detecção de ofensividade se aplica somente a específico
Now Assist habilidades e fluxos de trabalho. Não está disponível para todos
Now Assist aplicações. Para obter mais informações sobre a lista de habilidades compatíveis com a detecção de ofensividade, consulte
Guardião do Now Assist .
Você pode exportar logs para revisão. Para obter mais informações, consulte Exporte logs do Now Assist Guardian .
Procedimento
-
Navegar até .
-
No painel lateral, selecione guia.
-
Vá para Disponível para você para ver quais fluxos de trabalho você pode escolher.
As proteções de ofensividade que já estão ativadas aparecem em Ativo .
-
Selecione Ativar para o fluxo de trabalho no qual você deseja habilitar a detecção de ofensividade.
-
Em Escolha uma ação quando for detectado conteúdo ofensivo selecione uma das seguintes opções.
- Para registrar os eventos quando o conteúdo ofensivo é detectado, mantendo o conteúdo visível para o usuário, selecione Registre a saída . O conteúdo ofensivo ainda é mostrado ao usuário.
- Para registrar o evento e impedir que o conteúdo seja mostrado ao usuário, selecione Bloqueie a resposta e registre a saída . Em vez disso, o usuário vê uma mensagem de erro padrão.
-
Em Selecione o nível de gravidade do conteúdo para verificar se há ofensividade selecione uma das seguintes opções.
- Para sinalizar até mesmo as mais leves sugestões de conteúdo ofensivo, selecione Baixo .
- Para sinalizar conteúdo ofensivo claro ou moderado, selecione Médio .
- Para sinalizar somente conteúdo altamente ofensivo, selecione Alto .
-
Selecione Salve e ative .
-
Selecione Save (Salvar).
Resultado
A proteção de detecção de ofensividade está habilitada em sua instância para o fluxo de trabalho selecionado. Os eventos são registrados quando conteúdo ofensivo é detectado ou gerado.
O que Fazer Depois
Você pode habilitar a detecção de ofensividade para separadamente para cada compatível Now Assist aplicação e fluxo de trabalho. Repita esta tarefa para cada fluxo de trabalho no qual você deseja habilitar a proteção contra ofensividade.
Para alterar o impacto da detecção de um fluxo de trabalho ativo, selecione Mais opções (
) ícone na lista de fluxos de trabalho ativos e selecione Editar .
Para desativar a proteção ofensiva para um fluxo de trabalho, selecione Mais opções (
) na lista de fluxos de trabalho ativos e selecione Desativar .