Ative a proteção contra ofensividade para IA generativa

Segurança da plataforma da Austrália

Release

australia

ft:locale

pt-BR

ft:publication_title

Segurança da plataforma da Austrália

ft:clusterId

psec

bundleId

psec

workflow

Platform

Ative a proteção contra ofensividade para IA generativa

Versão de lançamento: Australia

Atualizado 31 de jul. de 2025

2 min. de leitura

Ative a detecção de ofensividade para registrar ou bloquear conteúdo ofensivo gerado por Now Assist habilidades e fluxos de trabalho.

Antes de Iniciar

Função necessária: sn_generative_ai.nsa_admin

Por Que e Quando Desempenhar Esta Tarefa

A saída da IA generativa é probabilística, o que significa que a mesma entrada pode produzir saídas diferentes. Parte do conteúdo gerado por IA pode ser ofensivo, o que inclui linguagem tóxica, sexista ou outra linguagem prejudicial. Guardião do Now Assist detecta conteúdo ofensivo em entradas e saídas e registra o evento quando ele é detectado. Você também pode configurá-lo para bloquear material ofensivo para que os usuários vejam uma mensagem de erro padrão em vez da resposta gerada.

Nota:

A detecção de ofensividade se aplica somente a específico Now Assist habilidades e fluxos de trabalho. Não está disponível para todos Now Assist aplicações. Para obter mais informações sobre a lista de habilidades compatíveis com a detecção de ofensividade, consulte Guardião do Now Assist .

Você pode exportar logs para revisão. Para obter mais informações, consulte Exporte logs do Now Assist Guardian .

Procedimento

Navegar até Tudo > Administração do Now Assist > Configurações.
No painel lateral, selecione Guardião do Now Assist > Ofensividade guia.
Vá para Disponível para você para ver quais fluxos de trabalho você pode escolher.

As proteções de ofensividade que já estão ativadas aparecem em Ativo .
Selecione Ativar para o fluxo de trabalho no qual você deseja habilitar a detecção de ofensividade.
Em Escolha uma ação quando for detectado conteúdo ofensivo selecione uma das seguintes opções.
- Para registrar os eventos quando o conteúdo ofensivo é detectado, mantendo o conteúdo visível para o usuário, selecione Registre a saída . O conteúdo ofensivo ainda é mostrado ao usuário.
- Para registrar o evento e impedir que o conteúdo seja mostrado ao usuário, selecione Bloqueie a resposta e registre a saída . Em vez disso, o usuário vê uma mensagem de erro padrão.
Em Selecione o nível de gravidade do conteúdo para verificar se há ofensividade selecione uma das seguintes opções.
- Para sinalizar até mesmo as mais leves sugestões de conteúdo ofensivo, selecione Baixo .
- Para sinalizar conteúdo ofensivo claro ou moderado, selecione Médio .
- Para sinalizar somente conteúdo altamente ofensivo, selecione Alto .
Selecione Salve e ative .
Selecione Save (Salvar).

Resultado

A proteção de detecção de ofensividade está habilitada em sua instância para o fluxo de trabalho selecionado. Os eventos são registrados quando conteúdo ofensivo é detectado ou gerado.

O que Fazer Depois

Você pode habilitar a detecção de ofensividade para separadamente para cada compatível Now Assist aplicação e fluxo de trabalho. Repita esta tarefa para cada fluxo de trabalho no qual você deseja habilitar a proteção contra ofensividade.

Para alterar o impacto da detecção de um fluxo de trabalho ativo, selecione Mais opções ( ) ícone na lista de fluxos de trabalho ativos e selecione Editar .

Para desativar a proteção ofensiva para um fluxo de trabalho, selecione Mais opções ( ) na lista de fluxos de trabalho ativos e selecione Desativar .