LLM 주제 테스트
채팅 창에서 대규모 언어 모델(LLM)을 사용하는 주제를 미리 보고, 테스트하고, 디버그합니다 가상 에이전트 디자이너 .
작업하는 동안 채팅 테스트 창에서 대화를 실행하여 주제의 기능을 테스트할 수 있습니다. 웹(서비스 포털) 채팅 클라이언트는 기본 테스트 창입니다.
대규모 언어 모델(LLM) 주제는 (NLU) 주제에 비해 자연어 이해 테스트가 더 빠르고 쉽습니다. 예를 들어 주제와 마찬가지로 NLU 발화를 업데이트하고 모델을 다시 학습한 후에는 주제를 다시 테스트할 필요가 없습니다.
외부 공급업체 메시징 앱과 Virtual Agent 통합을 사용하는 경우 대화의 요소가 외부 공급업체 메시징 애플리케이션에서 다르게 나타날 수 있습니다. 배포 가상 에이전트하려는 타사 응용 프로그램에서 대화를 테스트합니다.
채팅 테스트 창에서 LLM 주제 테스트하기
또는 주제(Topics) 페이지에서 활성(게시된) LLM 주제를 테스트할 수 있습니다. LLM 어시스턴트 필터를 사용하여 주제를 어시스턴트와 연결된 주제로만 제한한 다음 Test active topics(활성 주제 테스트)를 선택합니다. LLM 어시스턴트 필터를 사용하지 않는 경우 [Test LLM topics]를 선택합니다 Test active topics(활성 주제 테스트) 드롭다운 메뉴에서 LLM 어시스턴트와 연결된 주제를 테스트합니다. LLM 도우미에 대한 자세한 내용은 을 참조하십시오 LLM 도우미.
웹 클라이언트에서 채팅 테스트 창이 열리고 테스트 시 주제에 대한 세부 정보를 제공하는 인접 탭이 표시됩니다. LLM 주제를 테스트할 때 다음 탭을 사용할 수 있습니다.
- 테스트 구문 분석 - 입력을 기반으로 하는 주제 검색의 결과입니다.
- 프롬프트 검색 - LLM으로 전송되는 주제의 모든 프롬프트 목록입니다.
- 변수 - 입력 및 Live Agent 변수와 같이 대화에 사용되는 모든 변수의 목록입니다.
- 변수 편집 - 이 항목에 사용되는 변수를 편집하기 위한 옵션입니다.
- 컨텍스트 - 주제가 실행되는 컨텍스트(컨텍스트 변수 사용)를 지정하는 옵션입니다.
- 로그 - 수행된 처리의 목록입니다.
- 모든 LLM 주제 유형에 대해 [Analyze test phrases], [Prompt discovery], [Variables] 및 [Logs ] 탭이 나타납니다.
- 변수 편집 탭은 주제 블록 및 사용자 지정 통제에 대해 표시됩니다.
- 주제 검색 포함을 선택하면 주제, 설정 주제 또는 간단한 대화 주제에 대한 컨텍스트 탭이 나타납니다.
주제 페이지에서 테스트를 실행하는 경우 테스트 창에는 테스트 구문 분석, 변수, 컨텍스트 ( 기본적으로 사용 가능, 주제 검색 포함 옵션 없음) 및 로그 탭만 표시됩니다.
테스트 구 분석 탭
LLM이 활성화된 주제를 테스트할 때 입력에 따라 주제 검색에 대한 결과가 나타납니다. 테스트 구를 입력하면 입력 기술 및 출력 기술을 포함하여 기술 검색에 대한 주제 결과가 표시됩니다. 최종 주제 검색 출력에는 입력한 내용과 비교하여 선택한 주제의 정확도를 설명하는 등급이 포함됩니다.
기술 검색 입력 기술은 에서 검색 Now LLM하는 LLM 주제입니다. 기술 검색 출력 기술은 제시될 가능성이 가장 높은 테스트 Now LLM 구를 보여줍니다. 출력 기술 막대에 Sure, Unsure 또는 Unknown의 신뢰도 결과가 표시됩니다. 출력 기술 아래에 사용된 주제에는 점수와 함께 일치여부에 대한 부울이 표시됩니다. 기술 또는 주제에 따라 변수와 값이 나열될 수도 있습니다(예: 변수 @laptop_make 및 값 macbook).
출력 기술 막대에 좋지 않은 결과가 표시되면 주제에 대한 설명과 주제 노드의 지침을 조정하여 결과를 개선할 수 있습니다.
또한 주제 페이지에서 활성 LLM 도우미 주제를 테스트할 때 입력 기술 및 출력 기술을 포함하여 시맨틱 검색에 대한 기술 결과를 볼 수 있습니다. 의미 체계 검색은 검색어의 의미와 컨텍스트를 분석하고 해당 정보를 사용하여 유사한 의미를 가진 결과를 찾습니다. 검색 의도를 보다 정확하게 반영하도록 자연어를 해석하여 검색 상기를 개선합니다. 주제 검색 테스트를 위해 시맨틱 검색을 비활성화하면 해당 결과가 표시되지 않습니다. 시맨틱 검색에 대한 자세한 내용은 을 참조하십시오 Semantic vector search in AI Search.
프롬프트 검색 탭
주제에 LLM으로 전송되는 프롬프트가 포함되어 있는 경우 주제와 노드의 두 가지 범주로 표시됩니다. 주제 범주에는 주제 자체의 이름과 설명이 있습니다. 노드(Nodes) 카테고리에는 캔버스의 LLM 지원 사용자 입력 노드, 해당 필드 이름 및 유형, 해당 콘텐츠가 나열됩니다.
변수 탭
- 입력 변수
- 스크립트 변수
- Live Agent 변수
- 호출 주제와 주제 블록 간에 전달되는 변수
다음 예제에서는 그룹화된 목록 컨트롤에 대한 입력 변수 섹션을 보여 줍니다. 이 변수 정보는 정적 목록 컨트롤과 비슷하게 나타나지만 변수는 그룹화된 선택의 각 그룹으로 구분됩니다.
변수 편집 탭
주제, 주제 블록 및 간단한 대화 주제를 테스트할 때 주제의 노드에 있는 변수를 편집할 수 있습니다.
컨텍스트 탭
컨텍스트 탭은 주제, 설정 주제 또는 간단한 대화 주제를 테스트할 때 나타나 채팅에 대해 다른 컨텍스트를 지정합니다. 목록에서 컨텍스트 변수를 선택합니다. 변수에는 주제 의도를 확인하거나 채팅이 라이브 에이전트에게 라우팅되는 방식을 제어하는 데 사용할 수 있는 상황별 정보가 포함됩니다. 예를 들어 변수 목록에서 포털 을 선택하고 포털 이름인 IT Express를 입력할 수 있습니다. 테스트 케이스를 생성할 때는 컨텍스트 탭을 사용할 수 없습니다.
컨텍스트 변수 정의에 대한 자세한 내용은 을 참조하십시오 채팅 관련 정보를 저장할 컨텍스트 변수 구성. 에 포함된 가상 에이전트라이브 에이전트 변수에 대한 자세한 내용은 을 참조하십시오 라이브 에이전트 채팅 컨텍스트 변수.
다음 단계
주제 테스트가 완료되면 테스트 채팅 창을 닫습니다. 필요한 경우 테스트 정보를 사용하여 주제를 조정하여 더 정확하게 수행합니다. 예를 들어 테스트 구문 분석 탭의 결과는 낮은 점수 또는 확실하지 않음 또는 알 수 없음 신뢰 등급을 반환할 수 있습니다. LLM 지원 사용자 입력 노드에서 주제 설명 또는 지침을 업데이트하여 점수를 향상시킵니다.