외부 콘텐츠 커넥터의 WordPress 크롤링 설정 구성

  • 릴리스 버전: Australia
  • 업데이트 날짜 2026년 03월 12일
  • 소요 시간: 6분
  • 외부 콘텐츠 커넥터가 크롤링할 페이지와 블로그 게시물WordPress 을 지정합니다. 포함 또는 제외 필터를 정의하여 크롤링에서 검색하고 인덱싱을 위해 피드하는 AI 검색 콘텐츠의 유형을 지정합니다.

    시작하기 전에

    크롤링 설정을 구성하려는 외부 콘텐츠 커넥터를 커넥터 관리자가 이미 생성 WordPress 한 상태여야 합니다. 이 절차에 대한 자세한 내용은 다음 문서를 참조하십시오 WordPress 외부 콘텐츠 커넥터 생성.

    필요한 역할: sn_ext_conn.xcc_admin

    이 태스크 정보

    이 작업은 선택 사항입니다. 기본적으로 외부 콘텐츠 커넥터는 WordPress 지정된 소스 시스템에서 모든 페이지와 블로그 게시물 을 크롤링하고 지원되는 모든 파일 확장명을 가진 첨부 파일을 인덱싱으로 AI 검색 보냅니다. 커넥터가 다음과 같은 기본값이 아닌 설정을 사용하도록 하려는 경우에만 이 작업을 수행해야 합니다.
    • 콘텐츠 크롤링을 실행할 때 크롤링할 페이지와 블로그 게시물 에 대한 포함 또는 제외 필터
    • 콘텐츠 크롤링을 실행할 때 검색할 파일 확장명에 대한 포함 또는 제외 필터

    콘텐츠는 구성된 모든 크롤링 설정 필터를 통과하는 경우에만 소스 시스템에서 검색됩니다. 크롤링 설정 필터에서 콘텐츠 항목을 제외하는 경우 외부 콘텐츠 커넥터는 해당 콘텐츠를 검색하지 않습니다.

    중요사항:

    기본적으로 각 외부 콘텐츠 커넥터는 소스 시스템의 콘텐츠 항목까지 , 10,000,000) 인덱싱할 수 있습니다. 커넥터가 이 제한을 초과하면 소스 시스템을 계속 크롤링하지만 인덱싱을 AI 검색 위해 컨텐츠 항목 삭제 및 업데이트만 전송하고 새 컨텐츠 항목은 무시합니다. 커넥터는 인덱싱 제한을 초과하여 크롤링하는 콘텐츠 항목 10,000개마다 오류 메시지를 기록합니다.

    커넥터의 인덱싱된 콘텐츠 항목 수가 80만 명초과하면 커넥터의 UI에 경고 메시지가 나타나 인덱싱 제한에 근접하고 있음을 나타냅니다. 커넥터가 인덱싱 제한에 도달하면 UI에 오류 메시지가 나타납니다.

    사용자 권한 크롤링을 지원하는 외부 콘텐츠 커넥터는 최대 50만 명의 사용자와 해당 그룹에 대한 권한을 처리할 수 있습니다. 커넥터가 이 제한을 초과하여 사용자를 검색하는 경우 사용자 및 그룹 권한이 커넥터의 검색된 콘텐츠에 올바르게 적용되지 않을 수 있습니다. 따라서 콘텐츠를 검색하지 못할 수 있습니다.

    커넥터 중 하나가 콘텐츠 인덱싱 제한에 도달하면 크롤링 설정 및 파일 포함/제외 필터를 업데이트하여 검색하는 콘텐츠 항목 수를 줄일 수 있습니다. 또는 커넥터가 컨텐츠 항목보다 , 10,000,000 더 많이 인덱싱해야 하는 경우 케이스 https://support.servicenow.com/now고객 서비스 및 지원 생성하여 커넥터의 한도 증가를 요청할 수 있습니다.

    프로시저

    1. 다음으로 이동 모두 > 외부 콘텐츠 커넥터 > 외부 콘텐츠 관리자 홈.
    2. 커넥터 목록에서 설정을 수정할 외부 콘텐츠 커넥터의 WordPress 기록을 선택합니다.
    3. 커넥터 편집기의 설정 탭에서 크롤링 설정을 선택합니다.
    4. 다음 페이지 옵션 중 하나를 선택합니다.
      • 소스 시스템에서 모든 페이지를 크롤링하려면 모든 페이지 크롤링을 선택합니다.
      • 원본 시스템에서 지정된 페이지 집합만 크롤링하려면 이러한 페이지만 포함을 선택한 다음, 포함할 페이지 URL 추가 필드와 추가 버튼을 사용하여 크롤링할 때 커넥터에 포함할 페이지URL을 입력합니다.

        예를 들어, https://example.com/mainSite/mainPage 를 입력하여 이 페이지에서 검색 가능한 컨텐츠만 검색할 수 있습니다.

      • 소스 시스템에서 지정된 페이지 집합을 제외한 모든 페이지를 크롤링하려면 이러한 페이지만 제외를 선택한 다음 제외할 페이지 URL 추가 필드와 추가 버튼을 사용하여 크롤링할 때 커넥터에서 제외할 페이지URL을 입력합니다.

        예를 들어 https://example.com/testSite/testPage 를 입력하여 이 페이지에서 검색 가능한 컨텐츠를 제외할 수 있습니다.

    5. 다음 블로그 게시물 옵션 중 하나를 선택합니다.
      • 소스 시스템에서 모든 블로그 게시물 을 크롤링하려면 모든 블로그 게시물 크롤링을 선택합니다.
      • 소스 시스템에서 지정된 블로그 게시물 집합만 크롤링하려면 이러한 블로그 게시물만 포함을 선택한 다음 포함할 URL 추가 필드와 추가 버튼을 사용하여 크롤링할 때 커넥터에 포함할 블로그 게시물URL을 입력합니다.

        예를 들어, https://example.com/blog/latestContent 를 입력하여 이 블로그 게시물에서 검색 가능한 콘텐츠만 검색할 수 있습니다.

      • 소스 시스템에서 지정된 블로그 게시물 집합을 제외한 모든 블로그 게시물을 크롤링하려면 이러한 블로그 게시물만 제외를 선택한 다음 제외할 URL 추가 필드와 추가 버튼을 사용하여 크롤링할 때 커넥터에서 제외할 블로그 게시물URL을 입력합니다.

        예를 들어, 이 블로그 게시물에서 검색 가능한 컨텐츠를 제외하려면 https://example.com/blog/testPost 입력할 수 있습니다.

    6. 다음 범주 옵션 중 하나를 선택합니다.
      • 소스 시스템에서 모든 범주 에 속하는 블로그 게시물을 검색하려면 모든 범주 크롤링을 선택합니다.
      • 소스 시스템에서 지정된 범주 집합에 속하는 블로그 게시물만 검색하려면 이러한 범주만 포함을 선택한 다음 포함할 범주 필드와 추가 버튼을 사용하여 블로그 게시물을 크롤링할 때 커넥터에 포함할 범주URL을 입력합니다.

        예를 들어 회사 뉴스, 기술 블로그언론 이벤트를 입력하여 지정된 범주에 속하는 블로그 게시물에서 검색 가능한 컨텐츠만 검색할 수 있습니다.

      • 소스 시스템에서 지정된 범주 세트를 제외한 모든 범주에 속하는 블로그 게시물을 검색하려면 이러한 블로그 게시물만 제외한 다음 제외할 범주 필드와 추가 버튼을 사용하여 블로그 게시물을 크롤링할 때 커넥터가 제외할 범주URL을 입력합니다.

        예를 들어, 지정된 범주에 속하는 블로그 게시물에서 검색 가능한 컨텐츠를 제외하려면 테스트를 입력할 수 있습니다.

    7. 다음 날짜 옵션 중 하나를 선택합니다.
      • 작년에 수정된 페이지와 블로그 게시물 을 소스 시스템에서 검색하려면 작년에 수정됨을 선택합니다.
      • 지난 분기에 수정된 페이지와 블로그 게시물 을 소스 시스템에서 검색하려면 지난 분기에 수정됨을 선택합니다.
      • 지난 달에 수정된 페이지와 블로그 게시물 을 소스 시스템에서 검색하려면 지난 달에 수정됨을 선택합니다.
      • 지난 주에 수정된 페이지와 블로그 게시물 을 소스 시스템에서 검색하려면 지난 주 수정됨을 선택합니다.
    8. 다음 상태 옵션 중 하나를 선택합니다.
      • 소스 시스템에서 모든 상태 의 페이지와 블로그 게시물을 검색하려면 모든 상태 크롤링을 선택합니다.
      • 소스 시스템에서 지정된 상태 집합이 있는 페이지와 블로그 게시물만 검색하려면 이러한 상태만 포함을 선택한 다음 포함할 상태 필드와 추가 버튼을 사용하여 크롤링 시 커넥터에 포함할 상태를 입력합니다.

        예를 들어, publish 를 입력하여 이 상태의 페이지와 블로그만 검색할 수 있습니다.

      • 소스 시스템에서 지정된 상태 세트를 제외한 모든 상태 가 포함된 페이지와 블로그 게시물을 검색하려면 이러한 상태만 제외한 다음 제외할 상태 필드와 추가 버튼을 사용하여 크롤링 시 커넥터가 제외할 상태를 입력합니다.

        예를 들어, 비공개, 미래, 보류 중초안 을 입력하여 지정된 상태가 있는 페이지와 블로그를 제외할 수 있습니다.

    9. 다음 첨부 파일 옵션 중 하나를 선택합니다.
      • 소스 시스템에서 지원되는 파일 확장명을 가진 모든 첨부 파일을 검색하려면 모든 첨부 파일 크롤링을 선택합니다.
      • 소스 시스템에서 지정된 파일 확장명을 가진 첨부 파일만 검색하려면 이러한 파일 확장명만 포함을 선택한 다음 포함할 파일 확장 명 필드를 사용하여 크롤링 시 커넥터에 포함할 첨부 파일 확장명을 입력합니다.

        예를 들어 .docx 를 입력하여 해당 파일 형식의 Microsoft Word 첨부 파일만 검색할 수 있습니다.

      • 소스 시스템에서 지정된 파일 확장명을 가진 첨부 파일을 제외한 모든 첨부 파일을 검색하려면 이러한 파일 확장명만 제외를 선택한 다음 제외할 파일 확장 명 필드를 사용하여 크롤링 시 커넥터가 제외할 첨부 파일 확장명을 입력합니다.

        예를 들어 CSV(쉼표로 구분된 값) 파일 형식의 첨부 파일을 제외하려면 .csv 를 입력할 수 있습니다.

      지원되는 첨부 파일 확장명에 대한 자세한 내용은 다음 문서를 참조하십시오 외부 콘텐츠 커넥터에서 지원되는 이진 파일 확장명.
    10. 저장 및 확인을 선택합니다.

    결과

    WordPress 외부 콘텐츠 커넥터는 수정된 크롤링 설정으로 업데이트됩니다.

    다음에 수행할 작업

    수정된 크롤링 설정을 사용하여 소스 시스템에서 콘텐츠를 WordPress 검색하려면 외부 콘텐츠 커넥터에 대한 WordPress 일회성 콘텐츠 크롤링을 만들고 실행합니다. 일회성 컨텐츠 크롤링을 만들고 실행하는 방법에 대한 자세한 내용은 을 참조하십시오 외부 콘텐츠 커넥터용 콘텐츠 크롤링 생성.