Ative a proteção contra ofensividade para IA generativa

  • Versão de lançamento: Australia
  • Atualizado 31 de jul. de 2025
  • 2 min. de leitura
  • Ative a detecção de ofensividade para registrar ou bloquear conteúdo ofensivo gerado por Now Assist habilidades e fluxos de trabalho.

    Antes de Iniciar

    Função necessária: sn_generative_ai.nsa_admin

    Por Que e Quando Desempenhar Esta Tarefa

    A saída da IA generativa é probabilística, o que significa que a mesma entrada pode produzir saídas diferentes. Parte do conteúdo gerado por IA pode ser ofensivo, o que inclui linguagem tóxica, sexista ou outra linguagem prejudicial. Guardião do Now Assist detecta conteúdo ofensivo em entradas e saídas e registra o evento quando ele é detectado. Você também pode configurá-lo para bloquear material ofensivo para que os usuários vejam uma mensagem de erro padrão em vez da resposta gerada.
    Nota:
    A detecção de ofensividade se aplica somente a específico Now Assist habilidades e fluxos de trabalho. Não está disponível para todos Now Assist aplicações. Para obter mais informações sobre a lista de habilidades compatíveis com a detecção de ofensividade, consulte Guardião do Now Assist .

    Você pode exportar logs para revisão. Para obter mais informações, consulte Exporte logs do Now Assist Guardian .

    Procedimento

    1. Navegar até Tudo > Administração do Now Assist > Configurações.
    2. No painel lateral, selecione Guardião do Now Assist > Ofensividade guia.
    3. Vá para Disponível para você para ver quais fluxos de trabalho você pode escolher.

      As proteções de ofensividade que já estão ativadas aparecem em Ativo .

    4. Selecione Ativar para o fluxo de trabalho no qual você deseja habilitar a detecção de ofensividade.
    5. Em Escolha uma ação quando for detectado conteúdo ofensivo selecione uma das seguintes opções.
      • Para registrar os eventos quando o conteúdo ofensivo é detectado, mantendo o conteúdo visível para o usuário, selecione Registre a saída . O conteúdo ofensivo ainda é mostrado ao usuário.
      • Para registrar o evento e impedir que o conteúdo seja mostrado ao usuário, selecione Bloqueie a resposta e registre a saída . Em vez disso, o usuário vê uma mensagem de erro padrão.

      Proteção de ofensividade para com a ação "Registrar a saída" e o nível de gravidade "Baixo" selecionado.

    6. Em Selecione o nível de gravidade do conteúdo para verificar se há ofensividade selecione uma das seguintes opções.
      • Para sinalizar até mesmo as mais leves sugestões de conteúdo ofensivo, selecione Baixo .
      • Para sinalizar conteúdo ofensivo claro ou moderado, selecione Médio .
      • Para sinalizar somente conteúdo altamente ofensivo, selecione Alto .
    7. Selecione Salve e ative .
    8. Selecione Save (Salvar).

    Resultado

    A proteção de detecção de ofensividade está habilitada em sua instância para o fluxo de trabalho selecionado. Os eventos são registrados quando conteúdo ofensivo é detectado ou gerado.

    O que Fazer Depois

    Você pode habilitar a detecção de ofensividade para separadamente para cada compatível Now Assist aplicação e fluxo de trabalho. Repita esta tarefa para cada fluxo de trabalho no qual você deseja habilitar a proteção contra ofensividade.

    Para alterar o impacto da detecção de um fluxo de trabalho ativo, selecione Mais opções ( Ícone de Mais opções.) ícone na lista de fluxos de trabalho ativos e selecione Editar .

    Para desativar a proteção ofensiva para um fluxo de trabalho, selecione Mais opções ( Ícone de Mais opções.) na lista de fluxos de trabalho ativos e selecione Desativar .