GitHub Enterpriseクラウド外部コンテンツコネクタのクロール設定の構成

  • リリースバージョン: Australia
  • 更新日 2026年03月12日
  • 所要時間:4分
  • GitHub Enterprise Cloud 外部コンテンツコネクタでクロールするパブリックリポジトリと内部リポジトリを指定します。包含フィルターまたは除外フィルターを定義して、クロールが取得し、インデックス作成のために AI 検索 にフィードするコンテンツのタイプを決定します。

    始める前に

    コネクタアドミンは、クロール設定を構成する GitHub Enterprise クラウド外部コンテンツコネクタを既に作成している必要があります。この手順の詳細については、「GitHub Enterpriseクラウド外部コンテンツコネクタの作成」を参照してください。

    必要なロール:sn_ext_conn.xcc_admin

    このタスクについて

    このタスクはオプションです。デフォルトでは、 GitHub Enterprise クラウド外部コンテンツコネクタは、指定されたソースシステムからすべてのパブリックリポジトリと内部リポジトリをクロールし、すべてのコミット、問題、およびプル要求をインデックス作成のために AI 検索 に送信します。このタスクを実行する必要があるのは、コネクタで次のデフォルト以外の設定のいずれかを使用する場合のみです。
    • コンテンツクロールの実行時に 1 つ以上のデフォルトのコンテンツタイプを無視する
      • コミット
      • 問題
      • プル要求
    • コンテンツクロールの実行時にクロールするリポジトリの包含フィルターまたは除外フィルター

    コンテンツは、構成されたすべてのクロール設定フィルターに合格した場合にのみ、ソースシステムから取得されます。クロール設定フィルターでコンテンツアイテムが除外されている場合、外部コンテンツコネクタはコンテンツアイテムを取得しません。

    重要:

    デフォルトでは、各外部コンテンツコネクタは、ソースシステムから最大 1,000 (10,000,000) 個のコンテンツアイテムのインデックスを作成できます。コネクタは、この制限を超えると、ソースシステムのクロールを続行しますが、コンテンツアイテムの削除と更新のみをインデックス作成のために AI 検索 に送信し、新しいコンテンツアイテムは無視します。コネクタは、インデックス作成制限を超えてクロールする 10,000 のコンテンツアイテムごとにエラーメッセージをログに記録します。

    コネクタのインデックス付きコンテンツアイテムの数が 800,000 を超えると、インデックス作成の制限に近づいていることを示す警告メッセージがコネクタの UI に表示されます。コネクタがインデックス作成の制限に達すると、コネクタの UI にエラーメッセージが表示されます。

    ユーザー権限クロールをサポートする外部コンテンツコネクタは、最大 50 万人のユーザーとそのグループの権限を処理できます。コネクタがこの制限を超えてユーザーを取得すると、コネクタの取得されたコンテンツにユーザー権限とグループの権限が正しく適用されない可能性があります。その結果、コンテンツが検索できなくなる可能性があります。

    コネクタの 1 つがコンテンツインデックス作成の制限に達した場合は、そのクロール設定とファイルの包含/除外フィルターを更新して、取得するコンテンツアイテムの数を減らすことができます。または、10,000,000 を超えるコンテンツアイテムにインデックスを付けるためにコネクタが必要な場合は、https://support.servicenow.com/nowカスタマーサービス & サポートケースを作成して、コネクタの制限の引き上げを要求できます。

    手順

    1. 移動先 すべて > 外部コンテンツコネクタ > 外部コンテンツアドミンホーム.
    2. [コネクタ] リストで、設定を変更する GitHub Enterprise クラウド外部コンテンツコネクタのレコードを選択します。
    3. コネクタエディターの [ 設定 ] タブで、[ クロール設定] を選択します。
    4. [リポジトリ] セクションで、コネクタが検索可能なコンテンツとメタデータを取得するアイテムのタイプのオプションを選択します。
    5. 次の リポジトリ オプションのいずれかを選択します。
      • ソースシステムのすべてのリポジトリのアイテムのコンテンツを含めるには、[ すべてのリポジトリをクロール (Crawl all repositories)] を選択します。
      • 指定したリポジトリのセット内のアイテムのコンテンツのみを含めるには、[ これらのリポジトリのみを含める] を選択し、[ 含めるリポジトリ URL を追加 ] フィールドと [ 追加 ] ボタンを使用して、クロール時にコネクタに含めるリポジトリの URL を入力します。

        たとえば、「 https://github.com/example/production 」と入力すると、指定されたリポジトリ内のアイテムからのみ検索可能なコンテンツのみを取得できます。

      • 指定したリポジトリのセット内のアイテムからコンテンツを除外するには、[ これらのリポジトリのみを除外する] を選択し、[ 除外するリポジトリ URL を追加 ] フィールドと [追加 ] ボタンを使用して、クロール時にコネクタから除外するリポジトリの URL を入力します。

        たとえば、「 https://github.com/example/beta 」を入力して、指定したリポジトリ内のアイテムから検索可能なコンテンツを除外できます。

    6. [保存して検証] を選択します。

    タスクの結果

    GitHub Enterprise Cloud 外部コンテンツコネクタが、変更したクロール設定で更新されます。

    次のタスク

    変更したクロール設定を使用して GitHub Enterprise Cloud ソースシステムからコンテンツを取得するには、 GitHub Enterprise Cloud 外部コンテンツコネクタの 1 回限りのコンテンツクロールを作成して実行します。1 回限りのコンテンツクロールの作成と実行については、「 外部コンテンツコネクタのコンテンツクロールの作成」を参照してください。