Créer un connecteur de contenu externe Webcrawler

  • Rversion finale: Australia
  • Mis à jour 12 mars 2026
  • 6 minutes de lecture
  • Créez un connecteur de contenu externe pour récupérer le contenu pouvant faire l’objet de recherches à partir de pages et de sous-domaines dans un système source Web public. Sélectionnez parmi une liste de sources Web prédéfinies ou spécifiez votre propre source Web.

    Avant de commencer

    Rôle requis : sn_ext_conn.xcc_admin

    Pourquoi et quand exécuter cette tâche

    Suivez cette procédure pour créer un nouveau connecteur Webcrawler afin de récupérer le contenu et les métadonnées pouvant faire l’objet de recherches à partir d’URL trouvées dans une source Web prédéfinie ou personnalisée.

    Par défaut, vous pouvez configurer jusqu’à trois connecteurs Webcrawler pour les sources Web personnalisées. Si vous devez récupérer des éléments à partir de plus de trois sources Web personnalisées, vous pouvez créer un ticket à pour https://support.servicenow.com/now demander une Service et assistance client augmentation de la limite pour le connecteur Webcrawler.

    Procédure

    1. Accédez à la Tous > Connecteurs de contenu externe > Accueil de l'administrateur de contenu externe.
    2. Si vous y êtes invité, sélectionnez Changer de champ d’application pour passer au champ d’application administrateur des connecteurs de contenu externe.
      Vous devez être dans ce périmètre pour créer ou modifier des connecteurs de contenu externe.
    3. Dans la section Connecteurs, sélectionnez Nouveau.
    4. Sur la page Choisir la source, sélectionnez la vignette Webcrawler , puis sélectionnez Suivant.
    5. Sur la page Paramètres de connexion, spécifiez la source Web à partir de laquelle vous souhaitez récupérer le contenu pouvant faire l’objet de recherches.
      • Pour récupérer du contenu pouvant faire l’objet de recherches à partir d’une source Web dans la liste des sources Web prédéfinies, sélectionnez la vignette Source Web prédéfinie , puis sélectionnez la source Web souhaitée dans la liste.
      • Pour récupérer du contenu pouvant faire l’objet de recherches à partir d’une source Web publique non incluse dans la liste, sélectionnez la vignette Source Web personnalisée . Saisissez le nom du connecteur et l’URL de la source Web sélectionnée, puis sélectionnez l’option de clause de non-responsabilité juridique.
        Remarque :
        Si vous sélectionnez cette option, les analyses de contenu pour le connecteur de contenu externe Webcrawler récupèrent le contenu et les liens à partir des URL trouvées dans les plans du site du système source qui incluent l’URL du point de départ spécifiée. Le connecteur lit les URL correspondantes de tous les plans du site référencés dans le fichier de robots.txt du système source et de tous les plans du site situés dans des emplacements de plan du site communs.

        Par exemple, supposons que vous sélectionniez l’option Utiliser le plan du site , puis que vous spécifiiez https://example.com/mysite comme URL de point de départ pour une analyse de contenu. Lorsque vous exécutez l’analyse du contenu, le connecteur Webcrawler récupère le contenu et les liens à partir des URL du plan du site qui incluent https://example.com/mysite. Dans ce cas, le connecteur récupère le contenu et les liens à partir des URL du plan du site https://example.com/mysite/a et https://example.com/mysite/b , mais ignore les URL du plan du site https://example.com/othersite/c et https://example.com/yoursite/d , car elles n’incluent pas l’URL du point de départ.

    6. Enregistrez et validez vos paramètres de Suivant Valider la connexion.
      Remarque :
      Si la validation de vos paramètres de connexion échoue, le système affiche un message d’erreur. Vérifiez à deux reprises vos réglages de connexion pour vous assurer qu’ils sont corrects. Si les autorisations requises par le connecteur sont manquantes ou mal configurées dans le système source, un message d’avertissement s’affiche indiquant les autorisations à corriger. Fournissez les informations contenues dans ce message à votre administrateur système source.
    7. Sur la page Paramètres d’analyse, modifiez les paramètres d’analyse par défaut que vous souhaitez remplacer pour ce connecteur, puis sélectionnez Suivant.
      Si vous souhaitez ignorer cette étape pour l’instant, sélectionnez Ignorer au lieu de Suivant. Vous pouvez modifier les paramètres d’analyse pour ce connecteur à partir de la page Accueil de l’administrateur de contenu externe. Pour plus d’informations sur cette procédure et les paramètres d’analyse disponibles, consultez Configurer les paramètres d’analyse pour un connecteur de Atlassian Confluence Cloud contenu externe.
    8. Sur la page Créer une analyse, créez une analyse de contenu pour ce connecteur en sélectionnant une portée d’analyse (si elle est prise en charge) et toutes les options souhaitées, puis sélectionnez Suivant.
      Si vous souhaitez ignorer cette étape pour l’instant, sélectionnez Ignorer au lieu de Suivant. Vous pouvez créer et exécuter des analyses pour ce connecteur à partir de la page d’accueil de l’administrateur de contenu externe. Pour plus d’informations sur la création d’analyses de contenu, reportez-vous à la section Créer une analyse de contenu pour un connecteur de contenu externe.
    9. Sur la page de profil de recherche de Connect, utilisez le champ Se connecter au profil de recherche et le bouton Ajouter pour ajouter les profils de recherche auxquels vous souhaitez connecter la source de recherche par défaut de ce connecteur de contenu externe, puis sélectionnez Enregistrer.
      Si vous souhaitez ignorer cette étape pour l’instant, sélectionnez Ignorer au lieu de Suivant. Vous pouvez connecter des sources de recherche pour ce connecteur à des profils de recherche à partir de la page d’accueil de l’administrateur de contenu externe. Pour plus d’informations sur la connexion d’un connecteur de contenu externe aux profils de recherche, reportez-vous à la section Connecter un connecteur de contenu externe à un profil de recherche.

    Résultats

    Votre nouveau connecteur de contenu externe apparaît dans la liste Connecteurs de la page d’accueil de l’administrateur de contenu externe.

    Que faire ensuite

    Pour récupérer le contenu pouvant faire l’objet d’une recherche avec votre nouveau connecteur, vous devez configurer et exécuter des analyses de contenu pour celui-ci. Vous pouvez modifier les paramètres d’analyse de votre nouveau connecteur et créer des analyses pour celui-ci à partir de la page d’accueil de l’administrateur de contenu externe, même si vous avez ignoré ces étapes lors de la création du connecteur.
    Pour rendre le contenu analysé par votre nouveau connecteur consultable dans les portails et les applications de recherche, vous devez lier l’une de ses sources de recherche au profil de recherche utilisé par chaque portail ou application de recherche. Vous pouvez utiliser la source de recherche par défaut du connecteur ou créer vos propres sources de recherche personnalisées.
    Rechercher des sources Web prédéfinies
    Le connecteur de contenu externe Webcrawler inclut une source de recherche dédiée pour chaque source Web prédéfinie. Chaque source de recherche dédiée inclut le contenu de la source Web prédéfinie spécifiée qui est stocké dans la source indexée du connecteur. Utilisez ces sources de recherche pour accéder au contenu et aux métadonnées interrogeables récupérés à partir de sources Web prédéfinies. Par exemple, le contenu et les métadonnées interrogeables récupérés à partir de la Google Drive source Web prédéfinie sont accessibles dans une source de recherche nommée Google Drive.
    Source de recherche par défaut
    Par défaut, le système crée une source de recherche qui inclut tout le contenu pouvant être recherché à partir de vos connecteurs Webcrawler.
    Sources de recherche personnalisées
    Vous pouvez créer vos propres sources de recherche avec des filtres pour spécifier le contenu de la source indexée du connecteur qui peut faire l’objet de recherches. Pour afficher la source indexée du connecteur, accédez à Tous > Recherche IA > Recherche IA Indice > Sources indexées. Pour plus d’informations sur la création de sources de recherche, reportez-vous à la section Rechercher des sources dans Recherche IA.
    Vous pouvez lier les sources de recherche du connecteur aux profils de recherche à partir de la page d’accueil de l’administrateur de contenu externe. Pour plus de détails sur cette procédure, reportez-vous à la section Connecter un connecteur de contenu externe à un profil de recherche.