생성형 AI에 대한 불쾌한 콘텐츠 보호 활성화

  • 릴리스 버전: Yokohama
  • 업데이트 날짜 2025년 01월 30일
  • 읽기1분
  • 불쾌한 콘텐츠 보호 기능을 켜서 기록하고 AI 생성 텍스트 및 대화에서 불쾌한 콘텐츠를 차단하는 옵션을 추가합니다.

    시작하기 전에

    필요한 역할: sn_generative_ai.nsa_admin

    이 태스크 정보

    생성형 AI는 확률론적이므로 출력은 확률을 기반으로 하며 동일한 입력을 두 번 사용한다고 해서 동일한 출력이 보장되지는 않습니다. AI가 생성한 자료 중 일부는 독성, 성차별 또는 기타 불쾌한 감정으로 인해 잠재적으로 바람직하지 않을 수 있습니다. Now Assist 보호자를 사용하면 불쾌한 것으로 탐지된 모든 자료를 기록할 수 있습니다. 원하는 경우 사용자가 생성된 콘텐츠를 볼 수 없도록 불쾌한 자료를 차단할 수도 있습니다. 대신 불쾌감을 주는 자료가 감지되어 차단되었다는 메시지가 표시됩니다.

    자세한 내용은 Now Assist 보호자 를 참조하십시오.

    검토를 위해 로그를 익스포트할 수 있습니다. 이 작업을 수행하는 방법에 대한 지침은 Now Assist 보호자 로그 내보내기를 참조하세요.

    프로시저

    1. 다음으로 이동 모두 > Now Assist 관리자 > 설정.
    2. 측면 패널에서 Now Assist 보호자 > 불쾌한 콘텐츠 탐지 탭.
    3. 사용 가능 탭으로 이동하여 선택할 수 있는 워크플로우를 확인합니다.

      불쾌한 콘텐츠 가드레일이 이미 활성화되어 있는 경우 활성 탭에 표시됩니다.

    4. 불쾌한 콘텐츠 보호 기능을 사용하려는 워크플로우에 대해 활성화 를 선택합니다.
    5. 영향 탐지를 선택합니다.

      Now Assist 보호자는 불쾌한 콘텐츠가 탐지되거나 불쾌한 콘텐츠 보호가 활성화된 경우 생성됩니다. 사용자의 콘텐츠를 차단할지 여부를 선택할 수도 있습니다. 콘텐츠를 차단하도록 선택하면 사용자에게 불쾌한 콘텐츠가 생성되는 대신 차단되었음을 설명하는 표준화된 메시지가 표시됩니다.

      "로그만" 옵션이 선택된 Now Assist 보호자에 대한 불쾌한 콘텐츠 가드레일

    6. 저장을 선택합니다.

    결과

    선택한 워크플로우에 대해 인스턴스에서 Now Assist 보호자의 불쾌한 콘텐츠 가드레일이 활성화됩니다.

    다음에 수행할 작업

    인스턴스에서 활성화한 모든 Now Assist 애플리케이션에 대해 불쾌한 콘텐츠 보호 기능을 활성화할 수 있습니다. 탐지 영향을 변경하려면 활성 워크플로 목록에서 추가 옵션( 추가 옵션 아이콘.)을 선택하고 편집을 선택할 수 있습니다.

    추가 옵션을 선택하고 비활성화를 선택하여 언제든지 워크플로우에 대한 불쾌한 콘텐츠 보호 기능을 비활성화할 수 있습니다.