시맨틱 인덱스 구성 양식

  • 릴리스 버전: Yokohama
  • 업데이트 날짜 2025년 01월 30일
  • 읽기3분
  • 시맨틱 인덱스 구성 양식에는 인덱싱된 소스의 시맨틱 인덱싱 설정에 대한 정보가 포함되어 있습니다 AI 검색 . 인덱싱된 소스에 대한 시맨틱 인덱싱 설정을 정의하거나 수정할 때 이 양식을 사용합니다.

    인덱싱된 소스에 대한 의미 체계 인덱싱 설정 정의 및 수정에 대한 자세한 내용은 문서를 참조하십시오 인덱싱된 소스에 대한 시맨틱 인덱싱 설정 구성.
    주:
    이 양식은 인스턴스에서 활성화된 AI 검색 시맨틱 컨트롤러 플러그인(com.glide.ais.semantic_search) 경우에만 사용할 수 있습니다. 이 플러그인을 활성화하려면 인스턴스에 하나 이상의 플러그인이 있어야 합니다. Now Assist 애플리케이션 설치.
    표 1. 시맨틱 인덱스 구성 양식
    필드 설명
    이름 이 시맨틱 인덱스 구성으로 작성된 시맨틱 인덱스의 고유 이름입니다. 예를 들어 지식 테이블 인덱싱된 소스에 대한 시맨틱 인덱스 구성을 생성하는 경우 이름을 Knowledge-Table-semantic-index로 지정할 수 있습니다.
    주:
    시맨틱 인덱스의 이름에는 특수 문자, 밑줄 또는 공백을 사용할 수 없습니다.
    임베딩 모델 시맨틱 인덱스 구성에 사용할 임베딩 모델 목록입니다.
    • 기본값: ServiceNow Embedding (E5)
    • 지원되는 값:
      • ServiceNow Embedding (E5): 시맨틱 인덱스의 콘텐츠에 대해 미세 조정된 E5 포함 모델을 사용합니다. 임베딩 모델의 인코더 제한은 512개 용어입니다.
    활성 인스턴스에 대해 시맨틱 인덱스 구성을 활성화하는 옵션입니다. AI 검색 지정된 인덱스 소스에서 컨텐츠를 인덱싱할 때 비활성 시맨틱 인덱스 구성을 무시합니다.
    인덱싱된 소스

    이 시맨틱 인덱스 구성을 적용하려는 인덱싱된 소스에 대한 AI 검색 참조입니다. 이 필드는 자동으로 설정됩니다.

    인덱싱된 소스에 대한 자세한 내용은 을 참조하십시오 인덱싱된 소스.

    애플리케이션 시맨틱 인덱스 구성 기록에 대한 애플리케이션 범위입니다. 이 필드는 자동으로 설정됩니다.
    임베딩을 위한 청크 구성
    청크 분할 전략 임베딩 모델에 대해 의미론적으로 인덱싱된 텍스트를 청크할 때 사용할 전략입니다.
    • 기본값: Passage
    • 지원되는 값:
      • Passage: 더 긴 텍스트 필드 값에 대한 청크 전략입니다. 시맨틱 필드 값에서 청크 단위의 텍스트를 인덱싱합니다. 각 청크에는 및 Chunk Size 선택 항목에 따라 Chunk Unit 결정되는 최대 단어 또는 문장 수가 포함됩니다.
      • Truncate: 짧은 텍스트 필드 값에 대한 청크 전략입니다. 모든 시맨틱 인덱스 필드 값을 연결한 다음, 한도까지의 용어에 대한 시맨틱 인덱싱을 Maximum Total Words 수행합니다.
      • Full Text: 짧은 텍스트 필드 값에 대한 청크 전략입니다. 모든 시맨틱 인덱스 필드를 연결한 다음, 임베딩 모델의 인코더 제한까지 모든 용어에 대해 시맨틱 인덱싱을 수행합니다.
    • 유형: 선택
    중복 문장

    시맨틱 인덱스 필드 값에서 텍스트를 인덱싱할 때 청크 간에 겹치는 문장 수입니다. 중첩 값이 높을수록 성능이 저하되지만 시맨틱 벡터 검색에 대한 회수율이 증가합니다.

    이 필드는 에서 선택된 Chunking Strategy경우에만 Passage 나타납니다.

    • 기본값: 5
    • 지원되는 값: 음수가 아닌 모든 정수
    • 유형: 정수
    청크 단위

    시맨틱 벡터 검색을 위한 시맨틱 필드 값을 인덱싱할 때 청크 크기의 기준으로 사용할 텍스트 단위입니다.

    이 필드는 에서 선택된 Chunking Strategy경우에만 Passage 나타납니다.
    • 기본값: Words
    • 지원되는 값:
      • Words: 시맨틱 인덱스 필드 값이 청크되는 텍스트 단위로 단어를 사용합니다. 각 청크에는 Chunk Size 최대 단어가 포함될 수 있습니다.
      • Sentences: 시맨틱 인덱스 필드 값이 청크되는 텍스트 단위로 문장을 사용합니다. 각 청크에는 최대 문장이 Chunk Size 포함될 수 있습니다.
    • 유형: 선택
    청크 크기

    시맨틱 벡터 검색을 위한 시맨틱 필드 값을 인덱싱할 때 청크에 포함할 최대 단어 또는 문장 수(선택 항목에 Chunk Unit 따라 다름)입니다.

    이 필드는 에서 선택된 Chunking Strategy경우에만 Passage 나타납니다.
    • 기본값: 에서 Chunk Unit선택하면 250Words, 에서 선택하면 15 SentencesChunk Unit
    • 지원되는 값: 음수가 아닌 모든 정수
    • 유형: 정수
    최대 총 단어 수

    모든 시맨틱 인덱스 필드의 연결된 값에서 시맨틱 벡터 검색을 인덱싱할 최대 단어 수입니다.

    이 필드는 에서 선택된 Chunking Strategy경우에만 Truncate 나타납니다.
    • 기본값: 500
    • 지원되는 값: 음수가 아닌 모든 정수
    • 유형: 정수