Avaliar um prompt
Use as ferramentas de avaliação Kit de habilidades do Now Assist para avaliar a eficácia de suas sugestões de habilidades.
Antes de Iniciar
Função necessária: sn_skill_builder.admin
Procedimento
- Navegar até Tudo > Kit de habilidades do Now Assist > Página Inicial.
- Selecione a habilidade que você deseja avaliar.
- Selecione a guia Avaliação.
-
Crie um conjunto de dados a partir de uma tabela ou coleta de dados.
Tabela 1. Criar um conjunto de dados Método Etapas Criar um conjunto de dados a partir de uma tabela - Dê um nome e uma descrição ao conjunto de dados.
- Selecione Tabela.
- Encontre a tabela que você deseja usar.
- Selecione o número máximo de registros que você deseja usar.
- Adicione condições.
- Selecione Gerar visualização.
- Selecione os mapeamentos.
- Selecione Criar.
Criar um conjunto de dados a partir de uma coleta de dados - Dê um nome e uma descrição ao conjunto de dados.
- Selecione Coleta de dados.
- Selecione uma coleta de dados que você criou em Kit de dados do Now Assist.
- Selecione Gerar visualização.
- Selecione os mapeamentos.
- Selecione Criar.
-
Selecione o ícone de adição
para execuções de avaliação.
- Dê à execução de avaliação um nome e uma descrição.
- Selecione um ou mais prompts que você deseja avaliar.
- Selecione Salvar e Avançar.
- Selecione um conjunto de dados.
- Selecione Salvar e Avançar.
- Expanda a guia Qualidade.
-
Selecione as métricas que você deseja avaliar.
Tabela 2. Métricas de avaliação Método de avaliação Métrica Descrição Humano Feedback humano A avaliação humana é a opção padrão disponível para todas as execuções de prompt que geram uma resposta. Você pode classificar a resposta com um polegar para cima ou para baixo, com base em sua satisfação. Você também tem a opção de fornecer um feedback mais detalhado para explicar sua escolha de avaliação. Automatizado Exatidão A métrica de exatidão avalia a precisão, a integridade, a pertinência e a qualidade da escrita da resposta gerada em relação à instrução fornecida. Essa métrica ajuda a verificar se o texto reflete com precisão a instrução, cobre todos os pontos importantes, permanece relevante e está bem escrito. Automatizado Exatidão com resposta de ouro A métrica de exatidão com resposta de ouro usa uma referência predefinida para avaliar a precisão, completude, pertinência e qualidade de escrita da resposta gerada em relação à instrução fornecida. Essa métrica ajuda a verificar se o texto reflete com precisão a instrução, cobre todos os pontos importantes, permanece relevante e está bem escrito. Você deve usar essa métrica sempre que possível. Automatizado Fidelidade A métrica de fidelidade avalia se uma resposta gerada reflete com precisão as informações e o contexto fornecidos na instrução fornecida. Essa métrica ajuda a verificar se o texto não contém alucinações, fatos fabricados ou conclusões sem fundamento, mantendo o alinhamento com o material de origem. - Selecione Salvar e Avançar.
- Revise as escolhas de avaliação que você fez.
- Selecione Salvar e avaliar.
- Opcional:
Faça uma avaliação humana.
- Selecione Avaliação humana.
- Selecione um registro para usar na avaliação.
- Expanda o prompt e leia o resultado.
-
Selecione o ícone de polegar para cima ou para baixo
para fornecer sua avaliação.
- Adicione mais informações e selecione Enviar.