유사성 솔루션 생성 및 교육

  • 릴리스 버전: Washingtondc
  • 업데이트 날짜 2024년 02월 01일
  • 읽기5분
  • 머신 러닝 솔루션을 만들고 교육하여 기존 기록을 수집하고 유사한 새 레코드와 비교합니다. 예를 들어 오픈 인시던트 레코드의 텍스트를 해결된 인시던트 레코드와 비교하여 해결 방법을 재사용할 수 있습니다.

    시작하기 전에

    • 필요한 역할: ml_admin 또는 admin
    중요사항:
    릴리스에서는 Washington DC 클러스터링 및 유사성 모델이 워크플로우 솔루션을 사용합니다. 이들은 미리 학습되었으므로 새 솔루션에 단어 말뭉치가 필요하지 않습니다. 업그레이드 후 단어 말뭉치를 사용하는 기존 솔루션을 다시 교육하면 해당 솔루션이 워크플로우 솔루션이 되고 단어 말뭉치 필드가 양식에서 제거됩니다.

    이 태스크 정보

    예측 인텔리전스 는 원본 데이터가 이러한 유형의 암호화로 보호되는 교육 솔루션을 지원합니다.
    • FDE(전체 디스크 암호화).
    • 열 수준 암호화. Column Level Encryption을 사용하는 경우 sharedservice.worker 사용자에게 암호화에 사용된 것과 동일한 암호화 모듈 역할이 있는지 확인합니다.
    주:
    예측 인텔리전스 는 Edge Encryption으로 원본 데이터를 암호화하는 교육 솔루션을 지원하지 않습니다.

    시스템은 사전 학습되어 사용자가 단어 말뭉치를 빌드할 필요가 없는 워크플로우 유사성 솔루션을 사용합니다. 유사성을 기반으로 기존 기록을 비교한 후 시스템은 솔루션에서 검토하고 재사용할 수 있는 예제를 권장합니다.

    이 예시 절차에서는 인시던트 기록을 작업하고 있으며 해당 인시던트에 대한 해결책을 제공할 수 있는 관련 지식베이스 문서를 찾으려고 합니다.

    프로시저

    1. 다음으로 이동 모두 > Predictive Intelligence > 유사성 > 솔루션 정의레이블이 표시됩니다.
    2. 유사성 정의(Similarity Definitions) 목록에서 새로 만들기(New)를 클릭합니다.
    3. 유사성 정의 양식의 필드에 내용을 입력합니다.
      필드
      레이블 유사성 솔루션의 고유한 이름을 입력합니다. 예를 들어, 이 사용 사례에서는 인시던트를 지식 문서와 일치라고 입력할 수 있습니다.
      이름 솔루션 레이블 값을 입력하면 이 필드는 레이블 값과 유사한 시스템 할당 이름으로 자동으로 채워집니다.
      Word 말뭉치

      레거시 유사성 솔루션이 있는 경우 정의 양식의 단어 말뭉치 필드에서 관련 단어 말뭉치를 선택할 수 있습니다.

      주:
      Washington DC 릴리스에서는 미리 학습된 모델이 대신 사용되므로 단어 말뭉치가 필요하지 않습니다. 단어 말뭉치 필드는 미리 학습된 모델의 정의 양식에 표시되지 않습니다.

      자세한 내용은 단어 말뭉치 생성 문서를 참조하십시오.

      테이블

      양식의 첫 번째 열에서 다른 유사한 기록과 비교할 기록이 들어 있는 테이블을 선택합니다. 이 사용 사례에서는 해결하려는 인시던트 기록이 포함된 인시던트 [incident] 테이블을 선택합니다.

      테이블 값을 할당하면 현재 조건과 일치하는 기록 수를 보여주는 링크가 양식에 나타납니다.

      테스트 테이블
      양식의 두 번째 열에서 첫 번째 열 기록과 비교할 기록이 들어 있는 테이블을 선택합니다. 이 사용 사례에서는 해결하려는 인시던트 기록과 관련된 정보를 제공할 수 있는 KB 문서 기록이 포함된 Knowledge [kb_knowledge] 테이블을 선택합니다.
      주:
      조회 결과에 대해 유사성 창에서 검색할 수 있는 기록 수는 100,000개로 제한됩니다.
      필드
      양식의 첫 번째 열에서 다른 유사한 기록과 비교할 단어와 구를 포함할 가능성이 있는 필드 유형을 선택합니다. 이 예에서는 해결하려는 인시던트 기록의 텍스트를 포함하는 필드 유형인 짧은 설명을 선택합니다.
      주:
      저널 유형 이 지원되는 데이터 유형이 아닙니다.
      테스트 필드

      양식의 두 번째 열에서 첫 번째 열 기록과 비슷하거나 관련 있는 텍스트를 포함할 가능성이 있는 필드를 선택합니다. 이 예에서는 짧은 설명문서 본문을 선택합니다. 문서 본문을 포함하면 주제와 관련된 KB 문서 상세 정보를 캡처할 가능성이 높아집니다.

      필터

      유사성 결과를 검색하기 위해 기본으로 사용 중인 필드 기록에 조건을 적용하려면 필터 조건 추가를 클릭합니다. 예를 들어, 이 사용 사례에서는 작업 중인 인시던트 기록이 활성 상태이므로 [Active] [is] [true] 조건을 설정합니다.

      처리 언어 솔루션 정의에서 교육하려는 데이터 세트의 지배적 언어를 선택합니다. 데이터 세트 언어가 이탈리아어인 경우 이탈리아어를 선택합니다. 또한 기본적으로 모든 데이터 세트에 영어 처리가 적용됩니다. 예를 들어, 이탈리아어를 선택하면 시스템이 데이터를 영어와 이탈리아어로 처리합니다.
      주:
      처리 중이라는 용어는 솔루션 교육의 일부로 사용되는 언어별 단계를 나타냅니다. 예를 들면 단어 토큰화, 스톱 워드 제거, 어간 추출 등입니다.
      스톱 워드 처리 언어를 선택하면 시스템이 자동으로 동일한 언어를 사용하는 스톱 워드 목록을 추가합니다. 예를 들어, 처리 언어가 이탈리아어인 경우 기본 이탈리아어 스톱 워드 목록이 나타납니다. 기본 영어 스톱 워드 목록도 선택에 함께 표시됩니다. 사용자 지정 스톱 워드 목록을 만드는 경우 스톱 워드 필드에서 선택하고 솔루션에 추가할 수 있습니다.
      교육 빈도 매일 한 번 또는 매 30일 중에서 3개월 단위로 최대 180일까지 재교육 옵션을 선택합니다.
      업데이트 빈도 유사성 결과를 검색하는 데 사용하는 데이터를 얼마나 자주 새로 고칠지 선택합니다.

      예를 들어 오픈 상태인 인시던트 레코드가 있는 경우 일반적으로 새 인시던트가 하루 종일 자주 발생하므로 업데이트 빈도 를 15분마다로 선택할 수 있습니다. 이렇게 빈도를 설정하면 새로 열린 레코드가 새로 고침에 포함될 가능성이 높아질 수 있습니다.

      그러나 솔루션에서 일반적으로 자주 만들어지지 않는 KB 지식 문서 레코드를 사용하는 경우 1일마다와 같이 업데이트 빈도가 낮은 빈도를 선택할 수 있습니다.

      주:
      ML 스케줄러는 인스턴스가 커밋할 수 있는 교육의 수를 24시간 동안 인스턴스당 50개의 새로운 ML 교육 요청으로 제한합니다. 예약된 재교육 요청은 제외됩니다. 또한 새 교육 요청이 24시간 내에 50개를 초과하는 경우에도 클러스터링 및 유사성 업데이트는 이 제한에서 제외됩니다.
    4. 솔루션 정의에 해당하는 버튼을 클릭합니다.
      옵션설명
      저장 나중에 다시 돌아올 수 있도록 솔루션 정의 기록을 저장합니다.
      제출 및 교육 솔루션 정의 기록을 만들고 교육합니다.
    5. 교육용 솔루션을 제출한 경우에는 교육 활성화 창에서 확인을 클릭하여 확인합니다.

    결과

    • 가장 가까운 교육 서비스를 통해 처리할 솔루션 정의를 예약하고 교육이 완료되면 알림을 보냅니다. 알림에는 학습 중에 발생할 수 있는 모든 오류가 포함됩니다. 다른 사용자가 알림 범주를 예측 인텔리전스 구독할 수 있습니다.
    • 교육된 솔루션은 솔루션 정의 양식을 업데이트하여 유사성에 따라 순위가 매겨진 쌍을 이루는 솔루션 예제를 제공합니다.
    • 교육이 완료되면 시스템에서 솔루션을 첨부 레코드로 업로드합니다.

    다음에 수행할 작업

    솔루션 정의 양식의 관련 링크 섹션에서 교육이 완료된 유사성 솔루션 예시를 검토합니다. 솔루션 유사성 예시 검토 문서를 참조하십시오.