Amazon S3外部コンテンツコネクタのクロール設定の構成

  • リリースバージョン: Australia
  • 更新日 2026年03月12日
  • 所要時間:5分
  • 包含フィルターと除外フィルターを定義して、コンテンツのクロールの実行時に外部コンテンツコネクタが取得するバケットとファイルタイプを指定します Amazon S3

    始める前に

    コネクタアドミンは、クロール設定を構成するAmazon S3外部コンテンツコネクタを既に作成している必要があります。この手順の詳細については、「Amazon S3外部コンテンツコネクタの作成」を参照してください。

    必要なロール:sn_ext_conn.xcc_admin

    このタスクについて

    このタスクはオプションです。デフォルトでは、 Amazon S3 外部コンテンツコネクタは、指定されたソースシステムからすべてのバケットとファイルタイプをクロールし、サポートされているすべての拡張子を持つファイルをインデックス作成のために AI 検索 に送信します。このタスクを実行する必要があるのは、コネクタで次のデフォルト以外の設定のいずれかを使用する場合のみです。
    • コンテンツクロールの実行時にクロールするバケットの包含フィルターまたは除外フィルター
    • コンテンツのクロールの実行時に取得するファイル拡張子の包含フィルターまたは除外フィルター

    コンテンツは、構成されたすべてのクロール設定フィルターに合格した場合にのみ、ソースシステムから取得されます。クロール設定フィルターでコンテンツアイテムが除外されている場合、外部コンテンツコネクタはコンテンツアイテムを取得しません。

    重要:

    デフォルトでは、各外部コンテンツコネクタは、ソースシステムから最大 1,000 (10,000,000) 個のコンテンツアイテムのインデックスを作成できます。コネクタは、この制限を超えると、ソースシステムのクロールを続行しますが、コンテンツアイテムの削除と更新のみをインデックス作成のために AI 検索 に送信し、新しいコンテンツアイテムは無視します。コネクタは、インデックス作成制限を超えてクロールする 10,000 のコンテンツアイテムごとにエラーメッセージをログに記録します。

    コネクタのインデックス付きコンテンツアイテムの数が 800,000 を超えると、インデックス作成の制限に近づいていることを示す警告メッセージがコネクタの UI に表示されます。コネクタがインデックス作成の制限に達すると、コネクタの UI にエラーメッセージが表示されます。

    ユーザー権限クロールをサポートする外部コンテンツコネクタは、最大 50 万人のユーザーとそのグループの権限を処理できます。コネクタがこの制限を超えてユーザーを取得すると、コネクタの取得されたコンテンツにユーザー権限とグループの権限が正しく適用されない可能性があります。その結果、コンテンツが検索できなくなる可能性があります。

    コネクタの 1 つがコンテンツインデックス作成の制限に達した場合は、そのクロール設定とファイルの包含/除外フィルターを更新して、取得するコンテンツアイテムの数を減らすことができます。または、10,000,000 を超えるコンテンツアイテムにインデックスを付けるためにコネクタが必要な場合は、https://support.servicenow.com/nowカスタマーサービス & サポートケースを作成して、コネクタの制限の引き上げを要求できます。

    手順

    1. 移動先 すべて > 外部コンテンツコネクタ > 外部コンテンツアドミンホーム.
    2. [コネクタ] リストで、設定を変更する Amazon S3 外部コンテンツコネクタのレコードを選択します。
    3. コネクタエディターの 設定] タブで、[ [クロール設定] を選択します。
    4. 次のいずれかの コンテンツフィルタリング オプションを選択します。
      • ソースシステムからすべてのバケットをクロールするには、[ すべてのコンテンツをクロール] を選択します。
      • ソースシステムから指定したバケットのセットのみをクロールするには、[ これらのバケットのみを含める] を選択し、[ 含める S3 バケット URL を追加 ] フィールドと [追加 ] ボタンを使用して、クロール時に含めるバケットの URL を入力します。

        たとえば、「 https://s3.amazonaws.com/published 」と入力すると、 名前が公開済みのバケットから検索可能なコンテンツのみを含めることができます。

      • ソースシステムから指定したバケットのセットを除くすべてのバケットをクロールするには、[ これらのユーザーボックスのみを除外する] を選択し、[ 除外する S3 バケット URL を追加 ] フィールドと [追加 ] ボタンを使用して、クロール時にコネクタが除外するバケットの URL を入力します。

        たとえば、「 https://s3.amazonaws.com/legacy_bucket 」と入力して、 legacy_bucket という名前のバケットから検索可能なコンテンツを除外できます。

    5. 次のいずれかの ファイルタイプフィルタリング オプションを選択します。
      • サポートされているファイル拡張子を持つすべての添付ファイルをソースシステムから取得するには、[ すべての添付ファイルをクロール] を選択します。
      • 指定したファイル拡張子を持つ添付ファイルのみをソースシステムから取得するには、[ これらのファイル拡張子のみを含める] を選択し、[ 含めるファイル拡張子] フィールドを使用して、クロール時にコネクタに含める添付ファイル拡張子を入力します。

        たとえば、「 .docx 」と入力すると、 Microsoft Word ファイル形式の添付ファイルのみを取得できます。

      • 指定されたファイル拡張子を持つ添付ファイルを除くすべての添付ファイルをソースシステムから取得するには、[ これらのファイル拡張子のみを除外する] を選択し、[ 除外するファイル拡張子] フィールドを使用して、クロール時にコネクタで除外する添付ファイルの拡張子を入力します。

        たとえば、「 .csv 」と入力すると、カンマ区切り値 (CSV) ファイル形式の添付ファイルを除外できます。

      サポートされている添付ファイルの拡張子の詳細については、「 外部コンテンツコネクタでサポートされているバイナリファイル拡張子」を参照してください。
    6. [保存して検証] を選択します。

    タスクの結果

    Amazon S3外部コンテンツコネクタは、変更したクロール設定で更新されます。
    重要:
    コネクタが Amazon S3 バケットから取得するすべてのコンテンツは公開コンテンツとして扱われ、構成された AI 検索 エクスペリエンスにアクセスできるすべてのユーザーが検索できます。

    次のタスク

    変更したクロール設定を使用して Amazon S3 ソースシステムからコンテンツを取得するには、 Amazon S3 外部コンテンツコネクタの 1 回限りのコンテンツクロールを作成して実行します。1 回限りのコンテンツクロールの作成と実行については、「 外部コンテンツコネクタのコンテンツクロールの作成」を参照してください。