AI 検索 のインターナショナリゼーションサポート

  • リリースバージョン: Yokohama
  • 更新日 2025年02月04日
  • 所要時間:7分
  • AI 検索 は、Now Platform® が提供するすべての言語のインデックス作成と検索をサポートします。検索言語機能は 、ブラジルポルトガル語、オランダ語、英語、フランス語、カナダフランス語、ドイツ語、イタリア語、日本語、韓国語、ポルトガル語、簡体字中国語、スペイン語、スウェーデン語、繁体字中国語でサポートされています。

    インターナショナリゼーションのサポートは自動的に有効になり、構成することはできません。

    Now Platform プラグインとして提供され、AI 検索 でサポートされている言語の完全なリストを表示するには、「言語を有効にする」を参照してください。
    注:
    新しい言語プラグインを有効にした後、新しい言語で検索可能にするすべてのインデックス付きソースコンテンツを再インデックス作成する必要があります。再インデックス作成の詳細については、「単一のインデックス付きソースに対して完全なテーブルインデックス作成を実行するか、インデックス再作成を実行する」を参照してください。
    言語設定によって、AI 検索 がインデックス付きコンテンツと検索クエリのテキストを個々の用語に分割する方法が決定されます。トークン化と呼ばれるこのプロセスは、言語固有の設定を使用して、サポートされる言語ごとに異なる方法で処理されます。たとえば、ほとんどの言語ではスペースと句読点を使用して単語と文を区切りますが、中国語または日本語のテキストをトークン化する場合、AI 検索 は代わりにコンテキスト解釈を使用して単語と文の区切りを正しく識別します。日本語のテキストをトークン化する場合、AI 検索 は単語の区切り文字として中黒 (中央のドット) を追加で認識します。
    注:
    2024 年 8 月より前に ブラジルポルトガル語、オランダ語、イタリア語、日本語、韓国語、ポルトガル語、またはスウェーデン語 でコンテンツのインデックスを作成していた場合は、これらの言語に対する新しいトークン化改善のメリットを得るために、インデックスを再作成する必要があります。

    サポートされている言語でのインデックス作成の動作

    Now Platform ソースレコードまたは外部ドキュメントからコンテンツとメタデータにインデックス付けする場合、AI 検索 はレコードやドキュメントの言語に対してトークン化設定を使用します。これについては次のテーブルで示します。

    レコードまたはドキュメント トークン化設定
    タスク [task] テーブルまたはそのいずれかの子テーブルのソースレコード AI 検索 は言語の識別を実行し、検出された言語のトークン化設定を使用してレコードのコンテンツとメタデータにインデックスを付けます。
    注:
    言語識別では、、ブラジルポルトガル語、オランダ語、英語、フランス語、カナダフランス語、ドイツ語、イタリア語、日本語、韓国語、ポルトガル語、簡体字中国語、スペイン語、スウェーデン語、繁体字中国語 しか識別されません。他の言語のコンテンツは英語として識別されて処理されます。
    タスク以外のテーブルのソースレコード

    AI 検索 はレコードの言語のトークン化設定を使用して、そのコンテンツとメタデータにインデックスを付けます。

    レコードに言語が指定されていない場合、Now Platform ではインスタンスのデフォルトの言語を指定言語として扱います。たとえば、英語のインスタンスでは、AI 検索 は英語のトークン化設定を使用して、言語が指定されていないレコードにインデックスを付けます。

    外部ドキュメント AI 検索 は言語の識別を実行し、検出された言語のトークン化設定を使用してドキュメントのコンテンツとメタデータにインデックスを付けます。
    注:
    言語識別では、、ブラジルポルトガル語、オランダ語、英語、フランス語、カナダフランス語、ドイツ語、イタリア語、日本語、韓国語、ポルトガル語、簡体字中国語、スペイン語、スウェーデン語、繁体字中国語 しか識別されません。他の言語のコンテンツは英語として識別されて処理されます。
    注:
    コンテンツとメタデータにインデックスを付ける場合、AI 検索 は他の言語のテキスト内に埋め込まれた 日本語、簡体字中国語、繁体字中国語 テキストの領域を認識します。認識されたテキスト領域は、周囲のテキストの言語に関係なく、適切な言語トークン化設定でインデックス付けされます。たとえば、簡体字中国語の段落を含む英語のナレッジ記事にインデックスを付けるとします。AI 検索 は、この段落のコンテンツを中国語 (簡体字) として、レコードの残りの部分を英語としてインデックス付けします。

    サポートされている言語での検索クエリの動作

    検索クエリテキストを処理するとき、AI 検索 は現在のユーザーの Now Platform セッションの言語のトークン化設定を使用します。
    注:
    AI 検索 は、検索クエリ内の日本語、簡体字中国語、繁体字中国語の用語を認識します。認識された用語は、ユーザーセッションの言語に関係なく、適切な言語トークン化設定で処理されます。たとえば、フランス語のユーザーセッションで「remplacement ordinateur 笔记本电脑」を検索すると、AI 検索 は「笔记本电脑」という用語には中国語 (簡体字) 設定、その他の検索用語にはフランス語の設定を適用します。

    AI 検索 は、検索クエリ用語をインデックス付けされたコンテンツおよびメタデータの用語と比較し、インデックス付けされたうちで一致するものを含むレコードまたはドキュメントの検索結果を返します。検索用語がインデックス付けされた用語と同じ言語である場合、 AI 検索 は両方の用語セットを同じトークン化設定で処理し、予測可能な一致と検索結果を生成します。検索用語がインデックス付けされた用語と同じ言語でない場合、AI 検索 では 2 つの用語セットを異なるトークン化設定で処理するため、一致が予測できない場合があります。

    検索機能の言語依存性

    次の検索機能は言語に依存しており、リストされている言語でのみサポートされています。

    表 : 1. 検索機能の言語依存性
    機能 言語依存性とサポート対象言語
    Genius 結果

    AI 検索 は、リンクされた NLU モデルが検索クエリと同じ言語である場合にのみ、NLU トリガーを使用して Genius 結果構成を評価します。

    サポート対象言語:英語

    言語識別およびトークン化

    インデックス付けの処理中、AI 検索 はタスクテーブルレコードおよび外部ドキュメントで、サポート対象の言語を識別します。インデックス付きコンテンツのテキスト処理では、識別された言語のトークン化設定が使用されます。

    サポート対象言語:、ブラジルポルトガル語、オランダ語、英語、フランス語、カナダフランス語、ドイツ語、イタリア語、日本語、韓国語、ポルトガル語、簡体字中国語、スペイン語、スウェーデン語、繁体字中国語

    見出し語と Unicode 正規化

    AI 検索 は、インデックス付きコンテンツおよび検索クエリの用語に対して言語固有の見出し語正規化を実行します。

    サポート対象言語:、ブラジルポルトガル語、オランダ語、英語、フランス語、カナダフランス語、ドイツ語、イタリア語、日本語、韓国語、ポルトガル語、簡体字中国語、スペイン語、スウェーデン語、繁体字中国語
    注:
    、ドイツ語、韓国語、スウェーデン語 の場合、AI 検索 は見出し語の正規化に加えて用語の分解を実行します。

    AI 検索 は、インデックス付きコンテンツおよび検索クエリのすべての用語に対して Unicode 正規化を実行します。

    インデックス付きコンテンツおよび検索クエリでの見出し語と Unicode フォームの正規化の詳細については、「見出し語と Unicode 正規化」を参照してください。

    結果改善ルール

    AI 検索 は、検索クエリと同じ言語を使用するか、または [すべての言語] が指定されている結果改善ルールの有効化のみを評価します。

    サポートされている言語:インスタンスで有効化されているすべての言語。有効にできる言語のリストについては、「言語を有効にする」を参照してください。

    ストップワード

    AI 検索 では、検索クエリと同じ言語の辞書のストップワードのみが考慮されます。

    サポートされている言語:インスタンスで有効化されているすべての言語。有効にできる言語のリストについては、「言語を有効にする」を参照してください。

    同義語

    AI 検索 では、検索クエリと同じ言語の辞書の同義語のみが考慮されます。

    サポートされている言語:インスタンスで有効化されているすべての言語。有効にできる言語のリストについては、「言語を有効にする」を参照してください。

    タイポ処理

    AI 検索 は、検索ソースのインデックス付きコンテンツで見つかったサポートされている言語ごとに自動修正用語の個別のリストを導出します。自動修正は、検索クエリ用語を、検索クエリと同じ言語のリストからの用語に置き換えるのみです。

    サポート対象言語:ブラジルポルトガル語、オランダ語、英語、カナダフランス語、フランス語、ドイツ語、イタリア語、ポルトガル語、スペイン語、スウェーデン語タイポ処理は 日本語、韓国語、簡体字中国語、または繁体字中国語 ではサポートされていません。