의 국제화 지원 AI 검색

  • 릴리스 버전: Yokohama
  • 업데이트 날짜 2025년 02월 04일
  • 읽기5분
  • AI 검색 는 에서 Now Platform®제공하는 모든 언어로 인덱싱 및 검색을 지원합니다. 검색 언어 기능은 에서 지원됩니다 포르투갈어(브라질), 네덜란드어, 영어, 프랑스어, 프랑스어(캐나다), 독일어, 이탈리아어, 일본어, 한국어, 포르투갈어, 중국어(간체), 스페인어, 스웨덴어, 중국어(번체).

    국제화 지원은 자동으로 활성화되며 구성할 수 없습니다.

    플러그인으로 Now Platform 제공되고 지원되는 AI 검색언어의 전체 목록을 보려면 문서를 참조하십시오 언어 활성화.
    주:
    새 언어 플러그인을 활성화한 후에는 새 언어로 검색할 수 있도록 하려는 모든 인덱싱된 소스 컨텐츠를 다시 색인화해야 합니다. 재인덱싱에 대한 자세한 내용은 다음 문서를 참조하십시오 단일 인덱싱된 소스에 대해 전체 테이블 인덱스 수행 또는 재인덱싱 수행.
    언어 설정에 따라 인덱싱된 컨텐츠의 텍스트와 검색 쿼리를 개별 용어로 분리하는 방법이 AI 검색 결정됩니다. 토큰화라고 하는 이 프로세스는 언어별 설정을 사용하여 지원되는 각 언어에 대해 다르게 처리됩니다. 예를 들어, 대부분의 언어는 단어와 문장을 구분하기 위해 공백과 구두점을 사용하지만, 중국어 또는 일본어 텍스트를 AI 검색 토큰화할 때는 대신 문맥 해석을 사용하여 단어와 문장 분리를 올바르게 식별합니다. 일본어 텍스트를 토큰화할 AI 검색 때 나카구로(가운데 점)를 단어 구분 기호로 추가로 인식합니다.
    주:
    2024년 8월 이전에 콘텐츠를 인덱싱한 경우 해당 언어에 대한 새로운 토큰화 개선 사항의 이점을 누리려면 콘텐츠를 포르투갈어(브라질), 네덜란드어, 이탈리아어, 일본어, 한국어, 포르투갈어 또는 스웨덴어 다시 인덱싱해야 합니다.

    지원되는 언어의 인덱싱 동작

    원본 기록 또는 외부 문서에서 콘텐츠와 메타데이터를 Now Platform 인덱싱할 때 에서는 AI 검색 다음 표와 같이 기록 또는 문서의 언어에 대한 토큰화 설정을 사용합니다.

    기록 또는 문서 토큰화 설정
    작업 [task] 테이블 또는 하위 테이블 중 하나의 소스 기록 AI 검색 언어 식별을 수행하고 탐지된 언어에 대한 토큰화 설정을 사용하여 기록의 콘텐츠와 메타데이터를 인덱싱합니다.
    주:
    언어 식별은 .포르투갈어(브라질), 네덜란드어, 영어, 프랑스어, 프랑스어(캐나다), 독일어, 이탈리아어, 일본어, 한국어, 포르투갈어, 중국어(간체), 스페인어, 스웨덴어, 중국어(번체) 다른 언어로 된 컨텐츠는 영어로 식별되고 처리됩니다.
    비작업 테이블의 소스 기록

    AI 검색 는 기록 언어의 토큰화 설정을 사용하여 기록의 콘텐츠와 메타데이터를 인덱싱합니다.

    기록에 지정된 Now Platform 언어가 없으면 인스턴스의 기본 언어로 된 것으로 처리합니다. 예를 들어 AI 검색 영어 인스턴스에서는 영어의 토큰화 설정을 사용하여 지정된 언어가 없는 기록을 인덱싱합니다.

    외부 문서 AI 검색 언어 식별을 수행하고 탐지된 언어에 대한 토큰화 설정을 사용하여 문서의 컨텐츠와 메타데이터를 인덱싱합니다.
    주:
    언어 식별은 .포르투갈어(브라질), 네덜란드어, 영어, 프랑스어, 프랑스어(캐나다), 독일어, 이탈리아어, 일본어, 한국어, 포르투갈어, 중국어(간체), 스페인어, 스웨덴어, 중국어(번체) 다른 언어로 된 컨텐츠는 영어로 식별되고 처리됩니다.
    주:
    콘텐츠와 메타데이터를 인덱싱할 AI 검색 때 다른 언어의 텍스트에 포함된 텍스트 영역을 일본어, 중국어 간체 및 중국어 번체 인식합니다. 이러한 텍스트 영역은 주변 텍스트의 언어에 관계없이 적절한 언어 토큰화 설정으로 인덱싱됩니다. 예를 들어, 중국어 간체 단락이 포함된 영어 지식 문서를 인덱싱한다고 가정해 보겠습니다. AI 검색 는 이 문단의 내용을 중국어 간체로 색인화하고 나머지 기록 내용을 영어로 색인화합니다.

    지원되는 언어에서의 검색 쿼리 동작

    검색 쿼리 텍스트를 AI 검색 처리할 때 현재 사용자 Now Platform 세션의 언어에 대한 토큰화 설정을 사용합니다.
    주:
    AI 검색 검색 쿼리에서 용어를 인식합니다 일본어, 중국어 간체 및 중국어 번체 . 이러한 용어는 사용자 세션의 언어에 관계없이 적절한 언어 토큰화 설정으로 처리됩니다. 예를 들어 프랑스어 사용자 세션의 사용자가 remplacement ordinateur 笔记本电脑를 검색하는 경우 笔记本电脑AI 검색 용어에는 중국어 간체 설정을 적용하고 다른 검색어에는 프랑스어 설정을 적용합니다.

    AI 검색 검색 쿼리 용어를 인덱싱된 콘텐츠 및 메타데이터의 용어와 비교하여 인덱싱된 레코드 또는 일치하는 항목이 포함된 문서에 대한 검색 결과를 반환합니다. 검색어가 인덱싱된 용어 AI 검색 와 동일한 언어인 경우 토큰화 설정이 동일한 두 용어 집합을 모두 처리하여 예측 가능한 일치 항목 및 검색 결과를 생성합니다. 검색어가 인덱싱된 용어 AI 검색 와 동일한 언어가 아닌 경우 토큰화 설정이 다른 두 용어 집합을 처리하며 일치를 예측하지 못할 수 있습니다.

    검색 기능에 대한 언어 종속성

    다음 검색 기능은 언어에 따라 다르며 나열된 언어에 대해서만 지원됩니다.

    표 1. 검색 기능 언어 의존성
    기능 언어 의존성 및 지원되는 언어
    Genius 결과

    AI 검색연결된 NLU 모델의 언어가 검색 쿼리와 동일한 경우에만 트리거가 있는 NLU Genius 결과 구성을 평가합니다.

    지원되는 언어: 영어.

    언어 식별 및 토큰화

    인덱싱하는 AI 검색 동안 작업 테이블 기록 및 외부 문서에서 지원되는 언어를 식별합니다. 인덱싱된 콘텐츠에 대한 텍스트 처리는 식별된 언어에 대한 토큰화 설정을 사용합니다.

    지원되는 언어: 포르투갈어(브라질), 네덜란드어, 영어, 프랑스어, 프랑스어(캐나다), 독일어, 이탈리아어, 일본어, 한국어, 포르투갈어, 중국어(간체), 스페인어, 스웨덴어, 중국어(번체).

    보조정리 및 유니코드 정규화

    AI 검색 인덱싱된 컨텐츠 및 검색 쿼리의 용어에 대해 언어별 기본정리 정규화를 수행합니다.

    지원되는 언어: 포르투갈어(브라질), 네덜란드어, 영어, 프랑스어, 프랑스어(캐나다), 독일어, 이탈리아어, 일본어, 한국어, 포르투갈어, 중국어(간체), 스페인어, 스웨덴어, 중국어(번체).
    주:
    의 경우 , 독일어, 한국어, 스웨덴어기본 AI 검색 정리 정규화 외에 항 분해를 수행합니다.

    AI 검색 인덱싱된 컨텐츠 및 검색 쿼리의 모든 용어에 대해 유니코드 정규화를 수행합니다.

    인덱싱된 콘텐츠와 검색 쿼리에서 보조정리 및 유니코드 형식의 정규화에 대한 자세한 내용은 을 참조하십시오 보조정리 및 유니코드 정규화.

    결과 개선 규칙

    AI 검색 은 검색 쿼리와 언어가 동일하거나 모든 언어 가 지정된 결과 개선 규칙에 대해서만 활성화를 평가합니다.

    지원되는 언어: 인스턴스에서 활성화된 모든 언어입니다. 활성화할 수 있는 언어 목록은 다음 문서를 참조하십시오 언어 활성화.

    스톱 워드

    AI 검색 는 검색 쿼리와 동일한 언어를 사용하는 사전의 스톱 워드만 고려합니다.

    지원되는 언어: 인스턴스에서 활성화된 모든 언어입니다. 활성화할 수 있는 언어 목록은 다음 문서를 참조하십시오 언어 활성화.

    동의어

    AI 검색 검색 쿼리와 언어가 같은 사전의 동의어만 고려합니다.

    지원되는 언어: 인스턴스에서 활성화된 모든 언어입니다. 활성화할 수 있는 언어 목록은 다음 문서를 참조하십시오 언어 활성화.

    오타 처리

    AI 검색 는 검색 소스 인덱싱된 컨텐츠에 있는 지원되는 각 언어에 대해 자동 수정 용어의 별도 목록을 파생합니다. 자동 수정은 검색 쿼리 용어만 검색 쿼리와 동일한 언어를 가진 목록의 용어로 대체합니다.

    지원되는 언어: 포르투갈어(브라질), 네덜란드어, 영어, 프랑스어 - 캐나다, 프랑스어, 독일어, 이탈리아어, 포르투갈어, 스페인어 및 스웨덴어. 에 대한 일본어, 한국어, 중국어 간체 또는 중국어 번체오타 처리는 지원되지 않습니다.