Guardião do Now Assist análise
Monitore o desempenho das proteções habilitadas por meio de Guardião do Now Assist.
. Guardião do Now Assist O painel de análise ajuda os administradores a monitorar e avaliar a eficácia do conteúdo ofensivo e das proteções de injeção de prompt no acompanhamento e análise de solicitações enviadas para modelos de linguagem grandes (LLM) e suas respostas.
Os indicadores no Guardião do Now Assist a página do painel fornece as informações a seguir.
- Latência média como resultado de conteúdo ofensivo ativo e proteções de injeção de prompt. A alta latência pode significar aumento da atividade de proteção no período.
- Contagem e percentual de ocorrências de conteúdo ofensivo e injeção de prompt.
- Habilidades em que conteúdo ofensivo e ocorrências de injeção de prompt foram detectadas.
Aplique os filtros no painel para exibir a atividade de proteção para habilidades em um intervalo de datas. Consulte Análise do Now Assist detalhes do indicador do painel para obter informações sobre os dados e cálculos por trás de cada indicador.
Indicadores de conteúdo ofensivo
- Latência adicionada ao Guardrail
- Esta área do painel mostra a latência média como resultado da proteção de conteúdo ofensivo ativo para as habilidades selecionadas e o intervalo de datas.
Figura 2. Indicador de latência adicionado pelo Guardrail - Percentual sinalizado como ofensivo
- Esta área do painel mostra a porcentagem de solicitações e respostas de e para o serviço LLM que são sinalizadas para conteúdo ofensivo.
Figura 3. Percentual sinalizado como indicador ofensivo - Total de ocorrências de conteúdo ofensivo
- Esta área do painel mostra o número total de ocorrências de conteúdo ofensivo para as habilidades selecionadas e o intervalo de datas.
Figura 4. Indicador Total de ocorrências de conteúdo ofensivo - Categorias de conteúdo ofensivo
- Esta área do painel mostra um detalhamento de ocorrências de conteúdo ofensivo pelas categorias. Se o conteúdo for considerado ofensivo em mais de uma categoria, por exemplo, tóxico e difamatório, a ocorrência será contada individualmente para ambas as categorias. Para obter mais informações sobre categorias de conteúdo ofensivo, consulte Guardião do Now Assist.
Figura 5. Indicador de categorias de conteúdo ofensivo - Ocorrências de conteúdo ofensivo por habilidade
- Esta área do painel mostra o número de ocorrências de conteúdo ofensivo ao longo do tempo pelas habilidades nas quais o conteúdo é detectado.
Figura 6. Ocorrências de conteúdo ofensivo por indicador de habilidade
Indicadores de injeção de aviso
- Latência adicionada ao Guardrail
- Esta área do painel mostra a latência média como resultado da proteção de injeção de prompt ativa para as habilidades selecionadas e o intervalo de datas.
Figura 7. Indicador de latência adicionado pelo Guardrail - Percentual sinalizado como injeção de aviso
- Esta área do painel mostra a porcentagem de solicitações e respostas de e para o serviço LLM que são sinalizadas para conteúdo ofensivo.
Figura 8. Percentual sinalizado como indicador de injeção de aviso - Total de ocorrências de injeção de prompt
- Esta área do painel mostra o número total de ocorrências de conteúdo ofensivo para as habilidades selecionadas e o intervalo de datas.
Figura 9. Indicador Total de ocorrências de injeção de prompt - Ocorrências de injeção de prompt por habilidade
- Esta área do painel mostra o número de ocorrências de injeção de prompt ao longo do tempo pelas habilidades em que foram detectadas tentativas de injeção de prompt.
Figura 10. Ocorrências de injeção de prompt por indicador de habilidade