Ativar a proteção contra ofensividade da IA generativa

  • Versão de lançamento: Yokohama
  • Atualizado 30 de jan. de 2025
  • 1 min. de leitura
  • Ative a proteção contra ofensividade para registrar e adicionar a opção para bloquear conteúdo ofensivo em conversas e textos gerados por IA.

    Antes de Iniciar

    Função necessária: sn_generative_ai.nsa_admin

    Por Que e Quando Desempenhar Esta Tarefa

    A IA generativa é probabilística, o que significa que as saídas são baseadas em probabilidades e usar a mesma entrada duas vezes não garante a mesma saída. Parte do material gerado pela IA pode ser indesejável devido à toxidade, sexismo ou outro sentimento ofensivo. O guardião do Now Assist permite que você registre qualquer material que seja detectado como ofensivo. Se você quiser, também poderá bloquear material ofensivo para que os usuários não vejam o conteúdo gerado. Em vez disso, eles veem uma mensagem informando que o material ofensivo foi detectado e bloqueado.

    Consulte Guardião do Now Assist para obter mais informações.

    Os logs podem ser exportados para revisão. Para obter instruções sobre como fazer isso, consulte Exportar logs do guardião do Now Assist.

    Procedimento

    1. Navegar até Tudo > Administrador do Now Assist > Configurações.
    2. No painel lateral, selecione o Guardião do Now Assist > Ofensividade guia.
    3. Vá para a guia Disponível para você para ver quais fluxos de trabalho você pode escolher.

      Se você tiver proteções contra ofensividade já ativadas, elas serão exibidas na guia Ativo.

    4. Selecione Ativar para o fluxo de trabalho em que você deseja habilitar a proteção contra ofensividade.
    5. Selecione sua detecção de impacto.

      O guardião do Now Assist registra quando o conteúdo ofensivo é detectado ou gerado quando a proteção contra ofensividade está ativada. Você também pode escolher se deseja bloquear o conteúdo do usuário. Se você optar por bloquear o conteúdo, o usuário verá uma mensagem padronizada explicando que o material ofensivo foi bloqueado em vez do que foi gerado.

      Proteção contra ataques do guardião do Now Assist com a opção "somente registro em log" selecionada

    6. Selecione Save (Salvar).

    Resultado

    A proteção contra ataque do guardião do Now Assist está habilitada na sua instância para o fluxo de trabalho selecionado.

    O que Fazer Depois

    Você pode habilitar a proteção contra ofensividade para todas as aplicações do Now Assist que você habilitou em sua instância. Se você quiser mudar o impacto da detecção, poderá selecionar mais opções ( ícone Mais opções.) na lista de fluxos de trabalho ativos e escolher Editar.

    Você pode desativar a proteção contra ofensividade do fluxo de trabalho a qualquer momento selecionando mais opções e escolhendo Desativar.