Ativar a proteção contra ofensividade da IA generativa

Yokohama Habilitar IA

Release

yokohama

ft:locale

pt-BR

ft:publication_title

Yokohama Habilitar IA

ft:clusterId

platai

bundleId

platai

workflow

Platform

Ativar a proteção contra ofensividade da IA generativa

Versão de lançamento: Yokohama

Atualizado 30 de jan. de 2025

1 min. de leitura

Ative a proteção contra ofensividade para registrar e adicionar a opção para bloquear conteúdo ofensivo em conversas e textos gerados por IA.

Antes de Iniciar

Função necessária: sn_generative_ai.nsa_admin

Por Que e Quando Desempenhar Esta Tarefa

A IA generativa é probabilística, o que significa que as saídas são baseadas em probabilidades e usar a mesma entrada duas vezes não garante a mesma saída. Parte do material gerado pela IA pode ser indesejável devido à toxidade, sexismo ou outro sentimento ofensivo. O guardião do Now Assist permite que você registre qualquer material que seja detectado como ofensivo. Se você quiser, também poderá bloquear material ofensivo para que os usuários não vejam o conteúdo gerado. Em vez disso, eles veem uma mensagem informando que o material ofensivo foi detectado e bloqueado.

Consulte Guardião do Now Assist para obter mais informações.

Os logs podem ser exportados para revisão. Para obter instruções sobre como fazer isso, consulte Exportar logs do guardião do Now Assist.

Procedimento

Navegar até Tudo > Administrador do Now Assist > Configurações.
No painel lateral, selecione o Guardião do Now Assist > Ofensividade guia.
Vá para a guia Disponível para você para ver quais fluxos de trabalho você pode escolher.
Se você tiver proteções contra ofensividade já ativadas, elas serão exibidas na guia Ativo.
Selecione Ativar para o fluxo de trabalho em que você deseja habilitar a proteção contra ofensividade.
Selecione sua detecção de impacto.
O guardião do Now Assist registra quando o conteúdo ofensivo é detectado ou gerado quando a proteção contra ofensividade está ativada. Você também pode escolher se deseja bloquear o conteúdo do usuário. Se você optar por bloquear o conteúdo, o usuário verá uma mensagem padronizada explicando que o material ofensivo foi bloqueado em vez do que foi gerado.
Selecione Save (Salvar).

Resultado

A proteção contra ataque do guardião do Now Assist está habilitada na sua instância para o fluxo de trabalho selecionado.

O que Fazer Depois

Você pode habilitar a proteção contra ofensividade para todas as aplicações do Now Assist que você habilitou em sua instância. Se você quiser mudar o impacto da detecção, poderá selecionar mais opções ( ) na lista de fluxos de trabalho ativos e escolher Editar.

Você pode desativar a proteção contra ofensividade do fluxo de trabalho a qualquer momento selecionando mais opções e escolhendo Desativar.