모델 테스트 및 게시

  • 릴리스 버전: Australia
  • 업데이트 날짜 2026년 03월 12일
  • 소요 시간: 2분
  • 모델의 NLU 성능을 평가하여 개선이 필요한 영역을 식별합니다. 그런 다음 모델을 게시하여 다른 애플리케이션(예 가상 에이전트: )에서 사용할 수 있도록 합니다.

    요약 사용량

    기본 테스트 세트에 대해 사용자 가상 에이전트 또는 AI 검색 모델을 테스트하여 모델이 어떻게 반응하는지 확인합니다. 테스트 결과는 모델을 개선하는 데 사용할 수 있는 정보를 제공합니다.

    주:
    모델을 테스트하려면 다음의 NLU 워크벤치 - 고급 기능 애플리케이션 ServiceNow® Store에서 사용할 수 있는 다중 모델 배치 테스트 기능이 필요합니다. 자세한 내용은 NLU 워크벤치 설치 - 고급 기능 문서를 참조하십시오.

    모델을 테스트하려면 다음으로 이동하십시오. NLU 워크벤치 > 모델. 모델의 애플리케이션에 대한 탭을 선택한 다음 모델 이름을 선택합니다. 모델 테스트 및 게시 카드에서 단계 보기를 선택합니다. 모델 단계 카드 테스트 및 게시

    모델 테스트 및 게시 개요

    모델 테스트 및 게시 단계는 기본적으로 개요 페이지에서 열립니다. 새 테스트 실행모델 게시에 대한 버튼은 여기에 있습니다.

    모델 테스트 및 게시 개요 페이지

    개요 는 테스트 결과를 요약한 막대형 차트와 함께 이전 테스트 실행에 대한 정보를 제공합니다.

    이전 테스트 실행이 있는 경우 테스트 실행 날짜 목록에서 선택하여 볼 수 있습니다.

    테스트 실행 날짜 풀다운

    테스트 결과 테이블로 드릴다운하려면 세부 결과 탭을 선택합니다. 각 테스트 발언은 예측과 함께 자세한 결과에 나열됩니다.

    테스트 결과 이해

    테스트 결과는 모델이 테스트 세트의 발언에 어떻게 응답했는지 보여줍니다.

    NLU 워크벤치의 모델 테스트에 대한 테스트 결과입니다.

    막대형 차트에는 정답, 여러 항목 간의 정답, 누락 및 오답에 대한 예측 백분율이 표시됩니다.
    백분율 설명
    올바름 모델이 의도를 올바르게 예측한 발화의 백분율입니다.

    모델이 관련 없음으로 표시된 발화에 대한 의도를 예측하지 않으면 해당 결과는 올바른 것으로 계산됩니다.

    여러 항목 중 올바름

    둘 이상의 의도가 예측된 발언의 경우.

    모델이 의도를 올바르게 예측했지만 발화에 속하지 않는 의도도 예측한 발화의 백분율입니다.

    누락됨 예상 의도가 있었더라도 모델이 의도를 예측하지 못한 발화의 백분율입니다.
    잘못됨 모델이 정확하지 않은 의도를 예측한 발화의 백분율입니다.

    테스트는 모델의 신뢰도 임계치에 영향을 줄 수 있습니다. 신뢰도 임계치는 모델이 발언의 의도를 예측하기 위해 얼마나 신뢰해야 하는지를 결정합니다. 신뢰도 임계치에 대한 자세한 내용은 다음 문서를 참조하십시오 NLU 모델 설정.

    의도를 예측해서는 안 되는 발화에 대한 자세한 내용은 다음 문서를 참조하십시오 NLU의 관련 없음 탐지.

    모델 게시

    모델 게시 버튼을 누르면 다른 애플리케이션가상 에이전트에서 현재 버전의 모델을 사용할 수 있습니다.
    주:
    모델이 교육되지 않은 경우 모델 게시 버튼을 사용할 수 없습니다. 모델 빌드 및 교육 단계로 돌아가 게시하기 전에 모델을 교육하십시오.

    모델 게시에 대한 자세한 내용은 다음 문서를 참조하십시오 모델 게시 NLU.

    다중 모델 배치 테스트

    모델 테스트 및 게시 단계에서는 모델을 기본 테스트 세트에 대해 테스트합니다. 다중 모델 배치 테스트를 사용하면 다른 테스트 세트와 비교하여 테스트하고, 한 번에 여러 모델을 테스트하고, 테스트 결과를 확인할 수 있습니다. 다중 모델 배치 테스트를 사용하려면 다음으로 이동하십시오. NLU 워크벤치 > NLU 고급 기능 > 다중 모델 배치 테스트.

    자세한 내용은 다중 모델 배치 테스트 문서를 참조하십시오.

    테스트 세트에 대한 자세한 내용은 다음을 참조하십시오.

    테스트 프로세스에 대한 자세한 내용은 다음 문서를 참조하십시오 내 모델 테스트.