클러스터링 솔루션에 대한 Connect Component 알고리즘 및 Levenshtein Distance 방법 구성
구성 및 연결 구성요소 및 Levenshtein Distance 메서드 인코딩을 적용하여 클러스터링 솔루션에 대한 학습을 최적화합니다.
시작하기 전에
주:
ML 솔루션에서 고급 설정을 구성하는 것은 선택 사항입니다. 이러한 설정을 구성하도록 선택하는 경우 솔루션에서 사용하도록 설정하는 기술에 대해 잘 알고 있어야 하며 기술이 제공하는 기능을 통해 사용 사례가 이점을 얻을 수 있는지 확인합니다. 자세한 내용은 에 대한 ServiceNow 커뮤니티클러스터링 고급 매개 변수로 심층 분석 문서를 참조하십시오.
- 클러스터링 솔루션 정의를 생성 및 교육하거나 기존 솔루션 정의를 사용합니다.
- 필요한 역할: admin 또는 ml_admin
이 태스크 정보
클러스터링 솔루션을 교육할 때는 다음과 같은 세 가지 옵션이 있습니다.
- 디폴트 k-means 알고리즘을 사용합니다.
- 유클리드 거리 방법을 메트릭으로 사용하여 선택적 DBSCAN 솔루션 매개변수를 사용합니다.
- 선택적 DBSCAN, Minimum Neighbors 및 Levenshtein Distance 솔루션 매개변수를 사용합니다. Connect 구성요소는 DBSCAN 및 최소 이웃에서 사용할 수 있으며 단락 벡터 기반 텍스트와 Levenshtein 거리 기반 텍스트를 모두 지원합니다. Levenshtein Distance 방법을 사용하여 솔루션을 학습시키는 경우 클러스터링 솔루션에 단어 말뭉치를 사용할 필요가 없습니다.
이 예제 시나리오에서는 위에서 참조한 세 번째 옵션을 사용하여 솔루션 정의를 교육합니다.