단어 말뭉치 생성
시스템에서 텍스트 유사성을 기준으로 인스턴스 기록을 비교하는 데 사용하는 어휘로 기능하는 단어와 구문 모음을 빌드합니다. 말뭉치라는 단어는 기계 학습 시스템에서 이해하려는 사전으로 생각할 수 있습니다.
시작하기 전에
이 태스크 정보
중요사항:
단어 말뭉치의 주요 목적은 모델을 학습시키기 위한 텍스트 데이터를 유추하는 것입니다 NLU . 솔루션에서 단어 말뭉치를 사용하는 경우 솔루션의 솔루션 정의 단계에서 학습할 수 있도록 해당 단어 말뭉치를 지정해야 합니다. 학습된 단어 말뭉치는 솔루션과 기능 전반에 걸쳐 재사용할 수 있습니다.릴리스에서는 Washington DC 클러스터링 및 유사성 모델이 워크플로우 솔루션을 사용합니다. 이들은 미리 학습되었으므로 새 솔루션에 단어 말뭉치가 필요하지 않습니다. 업그레이드 후 단어 말뭉치를 사용하는 기존 솔루션을 다시 교육하면 해당 솔루션이 워크플로우 솔루션이 되고 단어 말뭉치 필드가 양식에서 제거됩니다.
레거시 컨텍스트에 대해 제공되는 정보는 다음과 같습니다.
단어 말뭉치를 사용하면 한 테이블이나 여러 테이블에서 유사한 기록 텍스트를 비교할 수 있습니다. 단어 말뭉치는 데이터 분석, 재사용 또는 검토를 위해 유사한 레코드를 함께 그룹화하는 클러스터링과 같은 다른 시나리오에서도 유용할 수 있습니다. 말뭉치에 추가하는 항목은 다른 유사성 또는 클러스터링 솔루션에서 재사용하고 다양한 사용 사례에 적용할 수 있도록 회사 및 산업별로 고유해야 합니다.
이 예시 절차에서는 인시던트 기록에 대한 작업을 수행하며 해당 인시던트 케이스에 대한 해결 방법을 제공할 수 있는 관련 지식베이스(KB) 문서를 찾으려고 합니다. 여기서 목표는 활성 인시던트를 게시된 KB 문서와 비교하는 새로운 유사성 솔루션에 적용할 수 있는 단어 말뭉치를 만드는 것입니다.