생성형 AI에 대한 불쾌한 콘텐츠 보호 활성화
불쾌한 콘텐츠 보호 기능을 켜서 기록하고 AI 생성 텍스트 및 대화에서 불쾌한 콘텐츠를 차단하는 옵션을 추가합니다.
시작하기 전에
필요한 역할: sn_generative_ai.nsa_admin
이 태스크 정보
생성형 AI는 확률론적이므로 출력은 확률을 기반으로 하며 동일한 입력을 두 번 사용한다고 해서 동일한 출력이 보장되지는 않습니다. AI가 생성한 자료 중 일부는 독성, 성차별 또는 기타 불쾌한 감정으로 인해 잠재적으로 바람직하지 않을 수 있습니다. Now Assist 보호자를 사용하면 불쾌한 것으로 탐지된 모든 자료를 기록할 수 있습니다. 원하는 경우 사용자가 생성된 콘텐츠를 볼 수 없도록 불쾌한 자료를 차단할 수도 있습니다. 대신 불쾌감을 주는 자료가 감지되어 차단되었다는 메시지가 표시됩니다.
자세한 내용은 Now Assist 보호자 를 참조하십시오.
검토를 위해 로그를 익스포트할 수 있습니다. 이 작업을 수행하는 방법에 대한 지침은 Now Assist 보호자 로그 내보내기를 참조하세요.
프로시저
결과
선택한 워크플로우에 대해 인스턴스에서 Now Assist 보호자의 불쾌한 콘텐츠 가드레일이 활성화됩니다.
다음에 수행할 작업
인스턴스에서 활성화한 모든 Now Assist 애플리케이션에 대해 불쾌한 콘텐츠 보호 기능을 활성화할 수 있습니다. 탐지 영향을 변경하려면 활성 워크플로 목록에서 추가 옵션( )을 선택하고 편집을 선택할 수 있습니다.
추가 옵션을 선택하고 비활성화를 선택하여 언제든지 워크플로우에 대한 불쾌한 콘텐츠 보호 기능을 비활성화할 수 있습니다.