WordPress外部コンテンツコネクタのクロール設定の構成

  • リリースバージョン: Australia
  • 更新日 2026年03月12日
  • 所要時間:8分
  • WordPress 外部コンテンツコネクタでクロールするページとブログ投稿を指定します。包含フィルターまたは除外フィルターを定義して、クロールが取得し、インデックス作成のために AI 検索 にフィードするコンテンツのタイプを決定します。

    始める前に

    コネクタアドミンは、クロール設定を構成するWordPress外部コンテンツコネクタを既に作成している必要があります。この手順の詳細については、「WordPress外部コンテンツコネクタの作成」を参照してください。

    必要なロール:sn_ext_conn.xcc_admin

    このタスクについて

    このタスクはオプションです。デフォルトでは、 WordPress 外部コンテンツコネクタは、指定されたソースシステムからすべての ページとブログ投稿 をクロールし、サポートされているすべてのファイル拡張子を持つ添付ファイルをインデックス作成のために AI 検索 に送信します。このタスクを実行する必要があるのは、コネクタで次のデフォルト以外の設定のいずれかを使用する場合のみです。
    • コンテンツクロールの実行時にクロールする ページとブログ投稿 の包含フィルターまたは除外フィルター
    • コンテンツのクロールの実行時に取得するファイル拡張子の包含フィルターまたは除外フィルター

    コンテンツは、構成されたすべてのクロール設定フィルターに合格した場合にのみ、ソースシステムから取得されます。クロール設定フィルターでコンテンツアイテムが除外されている場合、外部コンテンツコネクタはコンテンツアイテムを取得しません。

    重要:

    デフォルトでは、各外部コンテンツコネクタは、ソースシステムから最大 1,000 (10,000,000) 個のコンテンツアイテムのインデックスを作成できます。コネクタは、この制限を超えると、ソースシステムのクロールを続行しますが、コンテンツアイテムの削除と更新のみをインデックス作成のために AI 検索 に送信し、新しいコンテンツアイテムは無視します。コネクタは、インデックス作成制限を超えてクロールする 10,000 のコンテンツアイテムごとにエラーメッセージをログに記録します。

    コネクタのインデックス付きコンテンツアイテムの数が 800,000 を超えると、インデックス作成の制限に近づいていることを示す警告メッセージがコネクタの UI に表示されます。コネクタがインデックス作成の制限に達すると、コネクタの UI にエラーメッセージが表示されます。

    ユーザー権限クロールをサポートする外部コンテンツコネクタは、最大 50 万人のユーザーとそのグループの権限を処理できます。コネクタがこの制限を超えてユーザーを取得すると、コネクタの取得されたコンテンツにユーザー権限とグループの権限が正しく適用されない可能性があります。その結果、コンテンツが検索できなくなる可能性があります。

    コネクタの 1 つがコンテンツインデックス作成の制限に達した場合は、そのクロール設定とファイルの包含/除外フィルターを更新して、取得するコンテンツアイテムの数を減らすことができます。または、10,000,000 を超えるコンテンツアイテムにインデックスを付けるためにコネクタが必要な場合は、https://support.servicenow.com/nowカスタマーサービス & サポートケースを作成して、コネクタの制限の引き上げを要求できます。

    手順

    1. 移動先 すべて > 外部コンテンツコネクタ > 外部コンテンツアドミンホーム.
    2. [コネクタ] リストで、設定を変更する WordPress 外部コンテンツコネクタのレコードを選択します。
    3. コネクタエディターの [ 設定 ] タブで、[ クロール設定] を選択します。
    4. 次の ページ オプションのいずれかを選択します。
      • ソースシステムからすべての ページ をクロールするには、[ すべてのページをクロール] を選択します。
      • ソースシステムから指定されたページのセットのみをクロールするには、[これらのページのみを含める] を選択し、[含めるページ URL を追加] フィールドと [追加] ボタンを使用して、クロール時にコネクタに含めるページのURL を入力します。

        たとえば、このページから検索可能なコンテンツのみを取得するには、「https://example.com/mainSite/mainPage」と入力できます。

      • ソースシステムから指定されたページのセットを除くすべてのページをクロールするには、[これらのページのみを除外する] を選択し、[除外するページ URL を追加] フィールドと [追加] ボタンを使用して、クロール時にコネクタで除外するページのURL を入力します。

        たとえば、このページから検索可能なコンテンツを除外するには、「https://example.com/testSite/testPage」と入力します。

    5. 次の ブログ投稿 オプションのいずれかを選択します。
      • ソースシステムからすべての ブログ投稿 をクロールするには、[ すべてのブログ投稿をクロール] を選択します。
      • ソースシステムからブログ投稿の指定されたセットのみをクロールするには、[これらのブログ投稿のみを含める] を選択し、[含める URL を追加] フィールドと [追加] ボタンを使用して、クロール時にコネクタに含めるブログ投稿URL を入力します。

        たとえば、このブログ投稿から検索可能なコンテンツのみを取得するには、「https://example.com/blog/latestContent」と入力できます。

      • 指定したブログ投稿のセットを除くすべてのブログ投稿をソースシステムからクロールするには、[これらのブログ投稿のみを除外する] を選択し、[除外する URL を追加] フィールドと [追加] ボタンを使用して、クロール時にコネクタから除外するブログ投稿URL を入力します。

        たとえば、このブログ投稿から検索可能なコンテンツを除外するには、「https://example.com/blog/testPost」と入力できます。

    6. 次のいずれかの カテゴリ オプションを選択します。
      • ソースシステムからすべての カテゴリ に属するブログ投稿を取得するには、[ すべてのカテゴリをクロール] を選択します。
      • 指定したカテゴリのセットに属するブログ投稿のみをソースシステムから取得するには、[これらのカテゴリのみを含める] を選択し、[含めるカテゴリ] フィールドと [追加] ボタンを使用して、ブログ投稿をクロールするときにコネクタに含めるカテゴリURL を入力します。

        たとえば、[ 会社ニュース]、[ 技術ブログ]、および [プレスイベント ] と入力すると、指定された カテゴリに属するブログ投稿から検索可能なコンテンツのみを取得できます。

      • 指定したカテゴリセットを除くすべてのカテゴリに属するブログ投稿をソースシステムから取得するには、[これらのブログ投稿のみを除外する] を選択し、[除外するカテゴリ] フィールドと [追加] ボタンを使用して、ブログ投稿をクロールするときにコネクタで除外するカテゴリURL を入力します。

        たとえば、「 テスト」 と入力して、指定された カテゴリに属するブログ投稿から検索可能なコンテンツを除外できます。

    7. 次のいずれかの 日付 オプションを選択します。
      • 前年変更された ページとブログ投稿 をソースシステムから取得するには、[ 昨年変更済み] を選択します。
      • 前四半期に変更された ページとブログ投稿 をソースシステムから取得するには、[ 前四半期に変更] を選択します。
      • 先月変更された ページとブログ投稿 をソースシステムから取得するには、[ 先月変更] を選択します。
      • 先週変更された ページとブログ投稿 をソースシステムから取得するには、[ 先週変更済み] を選択します。
    8. 次のいずれかの ステータス オプションを選択します。
      • ソースシステムからすべての ステータス のページとブログ投稿を取得するには、[ すべてのステータスをクロール (Crawl all state)] を選択します。
      • 指定した 状況 セットを持つページとブログ投稿のみをソースシステムから取得するには、[ これらの状況のみを含める] を選択し、[ 含める状況 ] フィールドと [追加 ] ボタンを使用して、クロール時にコネクタに含める 状況 を入力します。

        たとえば、「 publish 」と入力すると、この ステータスのページとブログのみを取得できます。

      • 指定した 一連の状況 を除くすべての状況のページとブログ投稿をソースシステムから取得するには、[ これらの状況のみを除外する] を選択し、[ 除外する状況 ] フィールドと [追加 ] ボタンを使用して、クロール時にコネクタから除外する 状況 を入力します。

        たとえば、「 private」、「 future」、「 pending」、および「 draft 」と入力して、指定したステータスのいずれかを持つページとブログを除外できます。

    9. 次のいずれかの 添付ファイル オプションを選択します。
      • サポートされているファイル拡張子を持つすべての添付ファイルをソースシステムから取得するには、[ すべての添付ファイルをクロール] を選択します。
      • 指定したファイル拡張子を持つ添付ファイルのみをソースシステムから取得するには、[ これらのファイル拡張子のみを含める] を選択し、[ 含めるファイル拡張子] フィールドを使用して、クロール時にコネクタに含める添付ファイル拡張子を入力します。

        たとえば、「 .docx 」と入力すると、 Microsoft Word ファイル形式の添付ファイルのみを取得できます。

      • 指定されたファイル拡張子を持つ添付ファイルを除くすべての添付ファイルをソースシステムから取得するには、[ これらのファイル拡張子のみを除外する] を選択し、[ 除外するファイル拡張子] フィールドを使用して、クロール時にコネクタで除外する添付ファイルの拡張子を入力します。

        たとえば、「 .csv 」と入力すると、カンマ区切り値 (CSV) ファイル形式の添付ファイルを除外できます。

      サポートされている添付ファイルの拡張子の詳細については、「 外部コンテンツコネクタでサポートされているバイナリファイル拡張子」を参照してください。
    10. [保存して検証] を選択します。

    タスクの結果

    WordPress外部コンテンツコネクタは、変更したクロール設定で更新されます。

    次のタスク

    変更したクロール設定を使用して WordPress ソースシステムからコンテンツを取得するには、 WordPress 外部コンテンツコネクタの 1 回限りのコンテンツクロールを作成して実行します。1 回限りのコンテンツクロールの作成と実行については、「 外部コンテンツコネクタのコンテンツクロールの作成」を参照してください。