Guia Integridade em Torre de controle de IA

  • Versão de lançamento: Zurich
  • Atualizado 11 de ago. de 2025
  • 2 min. de leitura
  • Monitore o desempenho das proteções habilitadas por meio de Guardião do Now Assist.

    A guia Integridade no Torre de controle de IA O painel ajuda você a monitorar e avaliar a eficácia do conteúdo ofensivo e das proteções de injeção de prompt ativas em seus ativos de IA.

    Figura 1. Guia Integridade em Torre de controle de IA
    Guia Integridade mostrando métricas para conteúdo ofensivo e proteções de injeção de prompt
    As visualizações na guia Integridade fornecem as informações a seguir.
    • Latência média como resultado de conteúdo ofensivo ativo e proteções de injeção de prompt. A alta latência pode significar aumento da atividade de proteção no período.
    • Contagem e percentual de ocorrências de conteúdo ofensivo e injeção de prompt.
    • Habilidades em que conteúdo ofensivo e ocorrências de injeção de prompt foram detectadas.

    Aplique os filtros no painel para exibir a atividade de proteção para habilidades em um intervalo de datas.

    Eficácia da proteção de conteúdo

    Número de itens de conteúdo sinalizados
    Esta área do painel mostra o número de ocorrências de conteúdo ofensivo e de injeção de prompt no intervalo de datas selecionado.
    Figura 2. Número de itens de conteúdo sinalizados
    Visualização que mostra o número total de itens de conteúdo sinalizados para ofensivos e injeção de prompt
    Percentual de itens de conteúdo sinalizados de uso total
    Esta área do painel mostra a porcentagem de solicitações e respostas de e para o serviço de modelo de linguagem grande (LLM) que são sinalizadas para ofensibilidade e injeção de prompt.
    Figura 3. Percentual de itens de conteúdo sinalizados de uso total
    Visualização mostrando o percentual de itens de conteúdo sinalizados para ofensivos e injeção de prompt

    Visualizações de conteúdo ofensivo

    Latência adicionada ao Guardrail
    Esta área do painel mostra a latência média como resultado da proteção de conteúdo ofensivo ativo para as habilidades selecionadas e o intervalo de datas.
    Figura 4. Latência adicionada por Guardrail para ofensividade
    Latência do Guardrail para proteção de ofensividade
    Percentual sinalizado como ofensivo
    Esta área do painel mostra a porcentagem de solicitações e respostas de e para o serviço LLM que são sinalizadas para conteúdo ofensivo.
    Figura 5. Percentual sinalizado como ofensivo
    Percentual de ocorrências de conteúdo ofensivo.
    Total de ocorrências de conteúdo ofensivo
    Esta área do painel mostra o número total de ocorrências de conteúdo ofensivo para as habilidades selecionadas e o intervalo de datas.
    Figura 6. Total de ocorrências de conteúdo ofensivo
    Total de ocorrências de conteúdo ofensivo.
    Categorias de conteúdo ofensivo
    Esta área do painel mostra um detalhamento de ocorrências de conteúdo ofensivo pelas categorias. Se o conteúdo for considerado ofensivo em mais de uma categoria, por exemplo, tóxico e difamatório, a ocorrência será contada individualmente para ambas as categorias. Para obter mais informações sobre categorias de conteúdo ofensivo, consulte .
    Figura 7. Categorias de conteúdo ofensivo
    Visualização mostrando categorias de conteúdo ofensivo
    Ocorrências de conteúdo ofensivo por habilidade
    Esta área do painel mostra o número de ocorrências de conteúdo ofensivo ao longo do tempo pelas habilidades nas quais o conteúdo é detectado.
    Figura 8. Ocorrências de conteúdo ofensivo por habilidade
    Ocorrências de conteúdo ofensivo por habilidade.

    Visualizações de injeção de prompt

    Latência adicionada ao Guardrail
    Esta área do painel mostra a latência média como resultado da proteção de injeção de prompt ativa para as habilidades selecionadas e o intervalo de datas.
    Figura 9. Latência adicionada pelo Guardrail para injeção de prompt
    Visualização mostrando latência adicionada por proteção
    Percentual sinalizado como injeção de aviso
    Esta área do painel mostra a porcentagem de solicitações e respostas de e para o serviço LLM que são sinalizadas para conteúdo ofensivo.
    Figura 10. Percentual sinalizado como injeção de aviso
    Visualização que mostra a porcentagem de solicitações e respostas sinalizadas como injeção de prompt.
    Total de ocorrências de injeção de prompt
    Esta área do painel mostra o número total de ocorrências de conteúdo ofensivo para as habilidades selecionadas e o intervalo de datas.
    Figura 11. Total de ocorrências de injeção de prompt
    Total de ocorrências de injeção de prompt
    Ocorrências de injeção de prompt por habilidade
    Esta área do painel mostra o número de ocorrências de injeção de prompt ao longo do tempo pelas habilidades em que foram detectadas tentativas de injeção de prompt.
    Figura 12. Ocorrências de injeção de prompt por habilidade
    Visualização mostrando ocorrências de injeção de prompt por habilidade