모델 테스트 및 게시
모델의 NLU 성능을 평가하여 개선이 필요한 영역을 식별합니다. 그런 다음 모델을 게시하여 다른 애플리케이션(예 가상 에이전트: )에서 사용할 수 있도록 합니다.
요약 사용량
기본 테스트 세트에 대해 사용자 가상 에이전트 또는 AI 검색 모델을 테스트하여 모델이 어떻게 반응하는지 확인합니다. 테스트 결과는 모델을 개선하는 데 사용할 수 있는 정보를 제공합니다.
모델을 테스트하려면 다음으로 이동하십시오. . 모델의 애플리케이션에 대한 탭을 선택한 다음 모델 이름을 선택합니다. 모델 테스트 및 게시 카드에서 단계 보기를 선택합니다.
모델 테스트 및 게시 개요
모델 테스트 및 게시 단계는 기본적으로 개요 페이지에서 열립니다. 새 테스트 실행 및 모델 게시에 대한 버튼은 여기에 있습니다.
개요 는 테스트 결과를 요약한 막대형 차트와 함께 이전 테스트 실행에 대한 정보를 제공합니다.
이전 테스트 실행이 있는 경우 테스트 실행 날짜 목록에서 선택하여 볼 수 있습니다.
테스트 결과 테이블로 드릴다운하려면 세부 결과 탭을 선택합니다. 각 테스트 발언은 예측과 함께 자세한 결과에 나열됩니다.
테스트 결과 이해
테스트 결과는 모델이 테스트 세트의 발언에 어떻게 응답했는지 보여줍니다.
| 백분율 | 설명 |
|---|---|
| 올바름 | 모델이 의도를 올바르게 예측한 발화의 백분율입니다. 모델이 관련 없음으로 표시된 발화에 대한 의도를 예측하지 않으면 해당 결과는 올바른 것으로 계산됩니다. |
| 여러 항목 중 올바름 | 둘 이상의 의도가 예측된 발언의 경우. 모델이 의도를 올바르게 예측했지만 발화에 속하지 않는 의도도 예측한 발화의 백분율입니다. |
| 누락됨 | 예상 의도가 있었더라도 모델이 의도를 예측하지 못한 발화의 백분율입니다. |
| 잘못됨 | 모델이 정확하지 않은 의도를 예측한 발화의 백분율입니다. |
테스트는 모델의 신뢰도 임계치에 영향을 줄 수 있습니다. 신뢰도 임계치는 모델이 발언의 의도를 예측하기 위해 얼마나 신뢰해야 하는지를 결정합니다. 신뢰도 임계치에 대한 자세한 내용은 다음 문서를 참조하십시오 NLU 모델 설정.
의도를 예측해서는 안 되는 발화에 대한 자세한 내용은 다음 문서를 참조하십시오 NLU의 관련 없음 탐지.
모델 게시
모델 게시에 대한 자세한 내용은 다음 문서를 참조하십시오 모델 게시 NLU.
다중 모델 배치 테스트
모델 테스트 및 게시 단계에서는 모델을 기본 테스트 세트에 대해 테스트합니다. 다중 모델 배치 테스트를 사용하면 다른 테스트 세트와 비교하여 테스트하고, 한 번에 여러 모델을 테스트하고, 테스트 결과를 확인할 수 있습니다. 다중 모델 배치 테스트를 사용하려면 다음으로 이동하십시오. .
자세한 내용은 다중 모델 배치 테스트 문서를 참조하십시오.
테스트 프로세스에 대한 자세한 내용은 다음 문서를 참조하십시오 내 모델 테스트.