Préparer l’exécution du collecteur Databricks

  • Rversion finale: Australia
  • Mis à jour 12 mars 2026
  • 3 minutes de lecture
  • Effectuez les tâches d’authentification et de configuration des autorisations avant d’exécuter le collecteur de métadonnées Databricks.

    Avant de commencer

    Rôle requis : admin

    Procédure

    1. Générer les informations d’identification Databricks.

      Pour obtenir des instructions, consultez Générer des informations d’identification.

    2. Configurez les autorisations.

      Pour obtenir des instructions, consultez Configurer les autorisations.

    Générer des informations d’identification

    Générez un jeton d’accès personnel ou un secret principal de service pour authentifier la connexion Databricks.

    Avant de commencer

    Rôle requis : administrateur de compte

    Important :
    Vous devez être administrateur de compte dans Databricks pour créer et gérer les principaux de service.

    Pourquoi et quand exécuter cette tâche

    Configurez ces informations d’identification pour activer l’authentification pour le collecteur Databricks. Vous pouvez utiliser un jeton d’accès personnel (PAT) ou un principal de service OAuth.

    Procédure

    Générez les informations d’identification requises en fonction de votre méthode d’authentification.
    • Pour générer un jeton d’accès personnel (PAT) :

      1. Dans l’espace de travail Databricks, sélectionnez votre nom d’utilisateur dans la barre supérieure, puis sélectionnez Paramètres.
      2. Sélectionnez Développeur.
      3. À côté de Jetons d’accès, sélectionnez Gérer.
      4. Sélectionnez Générer un nouveau jeton.
      5. Saisissez un commentaire pour identifier le jeton.
      6. Modifiez le paramètre Durée de vie (jours) si nécessaire.
        Remarque :
        Pour créer un jeton avec une durée de vie maximale de 730 jours, laissez le champ de durée de vie vide.
      7. Sélectionnez Générer.
      8. Copiez le jeton affiché et sélectionnez Terminé. Conservez ce jeton en toute sécurité pour une utilisation ultérieure.
      9. Vous pouvez également utiliser l’API de jeton pour générer un PAT.
    • Pour générer un secret de principal de service :

      1. Dans l’espace de travail Databricks, sélectionnez votre nom d’utilisateur dans la barre supérieure, puis sélectionnez Paramètres.
      2. Accédez à l’onglet Identité et accès .
      3. En regard de Principaux du service, sélectionnez Gérer.
      4. Sélectionnez Ajouter le principal du service.
      5. Sélectionnez Ajouter, saisissez un nom pour le principal du service, puis sélectionnez Ajouter.
      6. Sélectionnez le principal de service nouvellement créé et accédez à l’onglet Secrets .
      7. Sélectionnez Générer une clé secrète.
      8. Saisissez la durée de vie du secret et sélectionnez Générer.
      9. Copiez l’ID client et le secret client dans la boîte de dialogue.

    Configurer les autorisations

    Accordez les autorisations nécessaires pour le catalogue, les tâches et les tables système Unity.

    Avant de commencer

    Rôle requis : admin

    Pourquoi et quand exécuter cette tâche

    Dans le catalogue Unity, les données sont sécurisées par défaut. Accordez des autorisations à l’utilisateur qui exécute le collecteur pour collecter des ressources. Les objets sécurisables dans le catalogue Unity sont hiérarchisés et les privilèges sont hérités vers le bas.

    Procédure

    1. Accordez des autorisations au catalogue Unity.
      L’utilisateur a besoin des autorisations USE CATALOG,USE SCHEMA et SELECT sur le catalogue pour accéder aux données.
      Remarque :
      Un utilisateur disposant des autorisations USE CATALOG et BROWSE peut accéder aux données, mais ne peut pas récupérer les statistiques de colonne, les fonctions système ou certaines métadonnées de table supplémentaires. Consultez la documentation Databricks pour plus de détails sur ces autorisations.
      1. Sélectionnez le catalogue auquel vous souhaitez accorder l’accès.
      2. Sélectionnez l’onglet Autorisations , puis Accorder.
      3. Sélectionnez l’utilisateur et les autorisations appropriées, puis sélectionnez Accorder.
    2. Accordez des autorisations de ressources de calcul.
      L’utilisateur doit disposer de l’autorisation Autoriser l’utilisation sur le cluster existant ou l’entrepôt SQL, ou peut créer ses propres ressources de calcul.
      1. Sélectionnez l’icône Plus d’options sur la ressource, puis sélectionnez Autorisations.
      2. Ajoutez l’utilisateur et sélectionnez l’autorisation Peut utiliser .
    3. Accordez des autorisations pour des tâches.
      Pour collecter des tâches, l’utilisateur exécutant le collecteur doit disposer des autorisations Peut afficher les tâches cibles. Pour plus d’informations sur la définition des autorisations de tâche, consultez la documentation Databricks.
    4. Activez la collecte de traçabilité à partir des tables système.
      Contactez votre administrateur Databricks pour activer le schéma system.access .
      1. Envoyez une demande PUT à l’API pour activer le schéma.
        curl -X PUT -H "Authorization: Bearer <PAT_Token>" https://<databricks-host>/api/2.1/unity-catalog/metastores/<metastore_id>/systemschemas/access

        Pour trouver le metastore_id, accédez à Catalogue > Paramètres et afficher la section des informations Metastore.

      2. Accordez les autorisations suivantes à l’utilisateur qui exécute le module de collection.
        • UTILISER LE SCHÉMA sur system.access
        • SÉLECTIONNER sur system.access.table_lineage
        • SÉLECTIONNER sur system.access.column_lineage

        Exemples de commandes SQL :

        GRANT USE SCHEMA ON SCHEMA system.access to `<userid>`;
                   GRANT SELECT on TABLE system.access.table_lineage to `<userid>`;
                   GRANT SELECT on TABLE system.access.column_lineage to `<userid>`;