Microsoft SharePoint Online外部コンテンツコネクタのクロール設定の構成

  • リリースバージョン: Australia
  • 更新日 2026年04月22日
  • 所要時間:6分
  • Microsoft SharePoint Online外部コンテンツコネクタでクロールするサイトを指定します。包含フィルターまたは除外フィルターを定義して、クロールが取得し、インデックス作成のために AI 検索 にフィードするコンテンツのタイプを決定します。

    始める前に

    コネクタアドミンは、クロール設定を構成するMicrosoft SharePoint Online外部コンテンツコネクタを既に作成している必要があります。この手順の詳細については、「Microsoft SharePoint Online外部コンテンツコネクタの作成」を参照してください。

    必要なロール:sn_ext_conn.xcc_admin

    このタスクについて

    このタスクはオプションです。デフォルトでは、 Microsoft SharePoint Online 外部コンテンツコネクタは、指定されたソースシステムからすべてのサイトをクロールします。サポートされているすべてのファイル拡張子を持つファイルと添付ファイルを含む、サポートされているすべてのコンテンツタイプをインデックス作成のために AI 検索 に送信します。このタスクを実行する必要があるのは、コネクタで次のデフォルト以外の設定のいずれかを使用する場合のみです。
    • コンテンツクロールの実行時にクロールするサイトの包含フィルターまたは除外フィルター
    • コンテンツのクロールの実行時に取得する添付ファイル拡張子の包含フィルターまたは除外フィルター

    コンテンツは、構成されたすべてのクロール設定フィルターに合格した場合にのみ、ソースシステムから取得されます。クロール設定フィルターでコンテンツアイテムが除外されている場合、外部コンテンツコネクタはコンテンツアイテムを取得しません。

    重要:

    デフォルトでは、各外部コンテンツコネクタは、ソースシステムから最大 1,000 (10,000,000) 個のコンテンツアイテムのインデックスを作成できます。コネクタは、この制限を超えると、ソースシステムのクロールを続行しますが、コンテンツアイテムの削除と更新のみをインデックス作成のために AI 検索 に送信し、新しいコンテンツアイテムは無視します。コネクタは、インデックス作成制限を超えてクロールする 10,000 のコンテンツアイテムごとにエラーメッセージをログに記録します。

    コネクタのインデックス付きコンテンツアイテムの数が 800,000 を超えると、インデックス作成の制限に近づいていることを示す警告メッセージがコネクタの UI に表示されます。コネクタがインデックス作成の制限に達すると、コネクタの UI にエラーメッセージが表示されます。

    ユーザー権限クロールをサポートする外部コンテンツコネクタは、最大 50 万人のユーザーとそのグループの権限を処理できます。コネクタがこの制限を超えてユーザーを取得すると、コネクタの取得されたコンテンツにユーザー権限とグループの権限が正しく適用されない可能性があります。その結果、コンテンツが検索できなくなる可能性があります。

    コネクタの 1 つがコンテンツインデックス作成の制限に達した場合は、そのクロール設定とファイルの包含/除外フィルターを更新して、取得するコンテンツアイテムの数を減らすことができます。または、10,000,000 を超えるコンテンツアイテムにインデックスを付けるためにコネクタが必要な場合は、https://support.servicenow.com/nowカスタマーサービス & サポートケースを作成して、コネクタの制限の引き上げを要求できます。

    手順

    1. 移動先 すべて > 外部コンテンツコネクタ > 外部コンテンツアドミンホーム.
    2. [コネクタ] リストで、設定を変更する Microsoft SharePoint Online 外部コンテンツコネクタのレコードを選択します。
    3. コネクタエディターの 設定] タブで、[ [クロール設定] を選択します。
    4. 次のいずれかの コンテンツフィルタリング オプションを選択します。
      • ソース システムからすべてのサイトをクロールするには、[すべてのコンテンツをクロールする]
      • ソース システムから指定されたサイトのセットのみをクロールするには、[ これらのサイトのみを含める] を選択し、[ URL の追加 ] フィールドと [追加 ] ボタンを使用して、クロールに含めるサイトの URL を入力します。

        たとえば、「 https://example.sharepoint.com/sites/ProductionSite 」と入力すると、指定したサイトからの検索可能なコンテンツのみを含めることができます。

      • ソース システムから指定されたサイトのセットを除くすべてのサイトをクロールするには、[ これらのサイトのみを除外する] を選択し、[ URL の追加 ] フィールドと [追加 ] ボタンを使用して、クロールから除外するサイトの URL を入力します。

        たとえば、「 https://example.sharepoint.com/sites/TestSite 」と入力すると、指定したサイトから検索可能なコンテンツが除外されます。

      重要:
      コネクタは、クロールごとに指定したサイトのアクセス許可を検証します。FullControl SharePoint API アクセス許可がないサイトが見つかった場合は、そのサイトのアラートを記録します。イベントのタイプは、問題のサイトが自動的に検出されたかどうか、またはサイト包含リストで指定されているかどうかによって異なります。
      • コネクタが FullControl 権限を持たないサイトを自動的に検出すると、そのサイトのインデックスを作成できないことを示す情報アラートが記録されます。
      • コネクタに包含リスト内のサイトに対する SharePoint API のフルコントロール権限がない場合は、そのサイトを トラバース (クロール) できないことを示す警告アラートが記録されます。
      Microsoft SharePoint Onlineサイトの SharePoint API 権限の構成の詳細については、「外部コンテンツのインデックス作成のための Microsoft SharePoint Online の構成Microsoft SharePoint Online 外部コンテンツコネクタのサイトとサイトコレクションへのアクセスを構成する」を参照してください。
    5. 次のいずれかの 添付ファイルフィルタリング オプションを選択します。
      • サポートされているファイル拡張子を持つすべての添付ファイルをソースシステムから取得するには、[ すべての添付ファイルをクロール] を選択します。
      • 指定したファイル拡張子を持つ添付ファイルのみをソースシステムから取得するには、[ これらのファイル拡張子のみを含める] を選択し、[ 含めるファイル拡張子] フィールドを使用して、クロール時にコネクタに含める添付ファイル拡張子を入力します。

        たとえば、「 .docx 」と入力すると、 Microsoft Word ファイル形式の添付ファイルのみを取得できます。

      • 指定されたファイル拡張子を持つ添付ファイルを除くすべての添付ファイルをソースシステムから取得するには、[ これらのファイル拡張子のみを除外する] を選択し、[ 除外するファイル拡張子] フィールドを使用して、クロール時にコネクタで除外する添付ファイルの拡張子を入力します。

        たとえば、「 .csv 」と入力すると、カンマ区切り値 (CSV) ファイル形式の添付ファイルを除外できます。

      サポートされている添付ファイルの拡張子の詳細については、「 外部コンテンツコネクタでサポートされているバイナリファイル拡張子」を参照してください。

    タスクの結果

    Microsoft SharePoint Online外部コンテンツコネクタは、クロールスコープとファイル拡張子フィルターの設定で更新されます。

    次のタスク

    変更したクロール設定を使用して Microsoft SharePoint Online ソースシステムからコンテンツを取得するには、 Microsoft SharePoint Online 外部コンテンツコネクタの 1 回限りのコンテンツクロールを作成して実行します。1 回限りのコンテンツクロールの作成と実行については、「 外部コンテンツコネクタのコンテンツクロールの作成」を参照してください。