Guardião do Now Assist análise

  • Versão de lançamento: Yokohama
  • Atualizado 7 de fev. de 2025
  • 2 min. de leitura
  • Monitore o desempenho das proteções habilitadas por meio de Guardião do Now Assist.

    O Guardião do Now Assist painel de análise ajuda os administradores a monitorar e avaliar a eficácia do conteúdo ofensivo e das proteções de injeção de prompt no acompanhamento e análise de solicitações enviadas para modelos de linguagem grandes (LLM) e suas respostas.

    Figura 1. Guardião do Now Assist página do painel
    Página do painel de injeção de prompt
    Os indicadores na página do painel Guardião do Now Assist fornecem as informações a seguir.
    • Latência média como resultado de conteúdo ofensivo ativo e proteções de injeção de prompt. A alta latência pode significar maior atividade de proteção no período.
    • Contagem e porcentagem de conteúdo ofensivo e ocorrências de injeção de prompt.
    • Habilidades em que foram detectadas ocorrências de conteúdo ofensivo e injeção de prompt.

    Aplique os filtros no painel para exibir a atividade de proteção das habilidades em um intervalo de datas. Consulte Análise do Now Assist detalhes do indicador do painel para obter informações sobre os dados e cálculos por trás de cada indicador.

    Indicadores de conteúdo ofensivo

    Latência adicionada ao guardrail
    Esta área do painel mostra a latência média como resultado da proteção de conteúdo ofensivo ativo para as habilidades e o intervalo de datas selecionados.
    Figura 2. Indicador de latência adicionado ao guardrail
    Latência da proteção para injeção de prompt.
    Percentual sinalizado como ofensivo
    Esta área do painel mostra a porcentagem de solicitações e respostas de e para o serviço LLM que são sinalizadas quanto a conteúdo ofensivo.
    Figura 3. Percentual sinalizado como indicador ofensivo
    Percentual de ocorrências de conteúdo ofensivo.
    Total de ocorrências de conteúdo ofensivo
    Esta área do painel mostra o número total de ocorrências de conteúdo ofensivo para as habilidades e o intervalo de datas selecionados.
    Figura 4. Indicador de total de ocorrências de conteúdo ofensivo
    Total de ocorrências de conteúdo ofensivo.
    Categorias de conteúdo ofensivo
    Esta área do painel mostra um detalhamento das ocorrências de conteúdo ofensivo por categorias. Se o conteúdo for considerado ofensivo em mais de uma categoria, por exemplo, tóxica e difamatória, a ocorrência será contada individualmente para ambas as categorias. Para obter mais informações sobre categorias de conteúdo ofensivo, consulte Guardião do Now Assist.
    Figura 5. Indicador de categorias de conteúdo ofensivo
    Indicador de categorias de conteúdo ofensivo.
    Ocorrências de conteúdo ofensivo por habilidade
    Esta área do painel mostra o número de ocorrências de conteúdo ofensivo ao longo do tempo pelas habilidades nas quais o conteúdo foi detectado.
    Figura 6. Ocorrências de conteúdo ofensivo por indicador de habilidade
    Ocorrências de conteúdo ofensivo por habilidade.

    Indicadores de injeção de prompt

    Latência adicionada ao guardrail
    Esta área do painel mostra a latência média como resultado da proteção de injeção de prompt ativa para as habilidades e o intervalo de datas selecionados.
    Figura 7. Indicador de latência adicionado ao guardrail
    Indicador de latência adicionado ao guardrail.
    Percentual sinalizado como injeção de prompt
    Esta área do painel mostra a porcentagem de solicitações e respostas de e para o serviço LLM que são sinalizadas quanto a conteúdo ofensivo.
    Figura 8. Percentual sinalizado como indicador de injeção de prompt
    Percentual sinalizado como indicador de injeção de prompt.
    Total de ocorrências de injeção de prompt
    Esta área do painel mostra o número total de ocorrências de conteúdo ofensivo para as habilidades e o intervalo de datas selecionados.
    Figura 9. Indicador de total de ocorrências de injeção de prompt
    Total de ocorrências de injeção de prompt
    Ocorrências de injeção de aviso por habilidade
    Esta área do painel mostra o número de ocorrências de injeção de prompt ao longo do tempo pelas habilidades em que as tentativas de injeção de prompt foram detectadas.
    Figura 10. Ocorrências de injeção de aviso por indicador de habilidade
    Ocorrências de injeção de aviso por indicador de habilidade.