테스트 세트를 만들거나 추가하려면 NLU 올바른 의도와 일치하는 테스트 발언 파일을 업로드할 수 있습니다. 테스트 세트를 사용하여 모델의 성능을 평가합니다.
시작하기 전에
NLU 워크벤치 코어 플러그인, NLU 워크벤치 플러그인, NLU 워크벤치 고급 기능 플러그인 및 예측 인텔리전스 플러그인이 모두 설치되고 활성화되어 있는지 확인합니다.
및 AI Search용 가상 에이전트 모델과 함께 NLU 테스트 세트를 사용할 수 있습니다.
필요한 역할: nlu_editor, nlu_admin 또는 admin 모델에 편집기를 할당해야 합니다.
이 태스크 정보
CSV 또는 XLSX(Excel 통합 문서) 파일에는 테스트 발화를 예상하는 의도와 쌍을 이루는 테이블이 포함되어야 합니다. 파일에는 최대 10,000개의 발화가 포함될 수 있습니다. 파일에 "발언" 및 "예상 의도"라는 제목의 열이 있는지 확인합니다.
주:
영어 이외의 언어로 된 테스트 세트의 경우 값이 UTF-8인 glide.import.csv.charset 시스템 속성을 추가해야 합니다. 임포트 세트 특성의 내용을 참조하십시오.
가장 정확한 테스트 결과를 얻으려면 모델이 사용자로부터 접할 수 있는 발언을 포함하십시오. 모델의 모든 의도를 다루는 테스트 발언이 있는지 확인합니다.
예상 의도가 없는 테스트 발화의 약 10%를 포함하는 것을 목표로 합니다. 예상 의도가 없는 발화를 포함하면 예측된 의도가 없어야 하는 관련 없는 발화를 탐지하는 모델의 기능을 평가하는 데 도움이 됩니다.
주:
파일의 테스트 발언에 예상 의도가 없음을 나타내려면 "예상 의도" 값이 비어 있어야 합니다.
표 1. 테스트 세트 테이블 예시
발언
예상 의도
햄버거 먹게 해줘
순서
지불하고 싶습니다.
지불
달콤한 걸 가져와줘
순서
식당이 열려 있습니까?
결제에 문제가 있습니다.
주문·지불
총 비용
지불
프로시저
다음으로 이동 모두 > NLU 워크벤치 > NLU 고급 기능 > 다중 모델 배치 테스트레이블이 표시됩니다.