생성형 AI에 대한 불쾌한 콘텐츠 보호 활성화
불쾌한 콘텐츠 탐지를 활성화하여 기술 및 워크플로우에서 Now Assist 생성된 불쾌한 콘텐츠를 기록하거나 차단합니다.
시작하기 전에
필요한 역할: sn_generative_ai.nsa_admin
이 태스크 정보
생성형 AI 출력은 확률론적이며, 이는 동일한 입력이 다른 출력을 생성할 수 있음을 의미합니다. AI 생성 콘텐츠 중 일부는 유해하거나, 성차별적이거나, 기타 유해한 언어를 포함하여 불쾌감을 줄 수 있습니다. Now Assist 가디언 는 입력 및 출력 모두에서 불쾌한 콘텐츠를 탐지하고 탐지되면 이벤트를 로깅합니다. 또한 불쾌한 내용을 차단하도록 구성하여 사용자에게 생성된 응답 대신 표준 오류 메시지를 볼 수 있습니다.
주:
불쾌한 콘텐츠 탐지는 특정 Now Assist 기술 및 워크플로우에만 적용됩니다. 일부 애플리케이션에만 Now Assist 사용할 수 있는 것은 아닙니다. 불쾌한 콘텐츠 탐지를 지원하는 기술 목록에 대한 자세한 내용은 Now Assist 보호자를 참조하십시오.
검토를 위해 로그를 익스포트할 수 있습니다. 자세한 내용은 Now Assist 보호자 로그 익스포트를 참조하십시오.
프로시저
결과
선택한 워크플로우에 대한 인스턴스에서 불쾌한 콘텐츠 탐지 가드레일이 활성화되어 있습니다. 불쾌한 콘텐츠가 탐지되거나 생성되면 이벤트가 기록됩니다.
다음에 수행할 작업
지원되는 Now Assist 각 애플리케이션 및 워크플로우에 대해 개별적으로 불쾌한 콘텐츠 탐지를 활성화할 수 있습니다. 불쾌한 콘텐츠 보호를 활성화하려는 각 워크플로우에 대해 이 작업을 반복합니다.
활성 워크플로우에 대한 탐지 영향을 변경하려면 추가 옵션( 을 선택합니다. 아이콘을 선택한 다음 편집을 선택합니다.
워크플로우에 대한 불쾌한 콘텐츠 탐지를 비활성화하려면 활성 워크플로우 목록에서 추가 옵션(아이콘을 선택한 다음 비활성화를 선택합니다.