클러스터링 솔루션에 대한 Connect Component 알고리즘 및 Levenshtein Distance 방법 구성

  • 릴리스 버전: Yokohama
  • 업데이트 날짜 2025년 02월 11일
  • 읽기2분
  • 구성 및 연결 구성요소 및 Levenshtein Distance 메서드 인코딩을 적용하여 클러스터링 솔루션에 대한 학습을 최적화합니다.

    시작하기 전에

    필요한 역할: admin 또는 ml_admin
    주:
    ML 솔루션에서 고급 설정을 구성하는 것은 선택 사항입니다. 이러한 설정을 구성하도록 선택하는 경우 솔루션에서 사용하도록 설정하는 기술에 대해 잘 알고 있어야 하며 기술이 제공하는 기능을 통해 사용 사례가 이점을 얻을 수 있는지 확인합니다. 자세한 내용은 에 대한 ServiceNow 커뮤니티클러스터링 고급 매개 변수로 심층 분석 문서를 참조하십시오.
    • 클러스터링 솔루션 정의를 생성 및 교육하거나 기존 솔루션 정의를 사용합니다.
    • 필요한 역할: admin 또는 ml_admin

    이 태스크 정보

    클러스터링 솔루션을 교육할 때는 다음과 같은 세 가지 옵션이 있습니다.

    • 디폴트 k-means 알고리즘을 사용합니다.
    • 유클리드 거리 방법을 메트릭으로 사용하여 선택적 DBSCAN 솔루션 매개변수를 사용합니다.
    • 선택적 DBSCAN, Minimum Neighbors 및 Levenshtein Distance 솔루션 매개변수를 사용합니다. Connect 구성요소는 DBSCAN 및 최소 이웃에서 사용할 수 있으며 단락 벡터 기반 텍스트와 Levenshtein 거리 기반 텍스트를 모두 지원합니다. Levenshtein Distance 방법을 사용하여 솔루션을 학습시키는 경우 클러스터링 솔루션에 단어 말뭉치를 사용할 필요가 없습니다.

    이 예제 시나리오에서는 위에서 참조한 세 번째 옵션을 사용하여 솔루션 정의를 교육합니다.

    프로시저

    1. 다음으로 이동 모두 > 예측 인텔리전스 > 클러스터링 > 솔루션 정의.
    2. 교육된 클러스터링 솔루션 정의 양식을 엽니다.
    3. 고급 솔루션 설정 탭에서 양식의 관련 링크 섹션에서 새로 만들기를 선택합니다.
      이 이미지는 매개변수를 생성하기 위해 솔루션 매개변수 옵션을 선택하는 방법을 보여줍니다.
    4. 매개변수 기록을 생성합니다.
      1. 솔루션 매개변수 필드에서 검색 아이콘을 선택합니다.
      2. ML 솔루션 매개변수 화면에서 Levenshtein 거리를 선택합니다.
      검색 단추를 선택한 다음 Levenshtein Distance 키의 간단한 설명을 선택하여 매개 변수 레코드를 만드는 방법입니다.
    5. 제출을 선택합니다.

      고급 솔루션 설정 기록 화면이 새로 고쳐집니다.

      방금 할당한 값에서 생성하는 새 솔루션 매개변수 기록입니다.

    6. 제출을 선택합니다.

      결과: Levenshtein Distance는 클러스터링 솔루션에 대해 구성됩니다. 해당 솔루션 매개변수는 클러스터링 정의 양식의 고급 솔루션 설정 탭에 나타납니다.

      생성한 기록을 제출하면 클러스터링 솔루션 정의 양식에 Levenshtein Distance 솔루션 매개변수가 나타납니다.
    7. 이전 Levenshtein 거리 예의 1-6단계를 반복합니다. 단, 이번에는 최소 인접 항목DBSCAN 솔루션 매개변수를 생성하여 구성요소 연결 기능을 함께 활성화합니다.
      클러스터링 솔루션에 추가해야 하는 나머지 두 솔루션 매개변수입니다. 이 두 개의 최종 매개 변수는 구성 요소 연결 기능을 활성화합니다.

      최소 인접 항목 솔루션 매개 변수를 선택, 구성 및 제출할 때 사용자 입력 필드를 값 1로 설정해야 합니다. 일부 매개변수에만 사용자 입력 필드가 있습니다.

      Minimum Neighbors 파라미터에 대한 User Inputs(사용자 입력) 필드에 값을 추가하는 방법 이 시나리오에서는 값 1을 입력합니다.

      결과:

      커넥트 구성요소는 클러스터링 솔루션에 대해 구성되어 있습니다. 두 개의 솔루션 매개변수가 이 절차의 1-6단계에서 구성한 Levenshtein Distance 매개변수와 함께 클러스터링 정의 양식의 고급 솔루션 설정 탭에 나타납니다.

      클러스터링 솔루션의 고급 솔루션 설정 섹션에서 구성한 세 가지 솔루션 매개변수입니다.