Créer une connexion Databricks

  • Rversion finale: Yokohama
  • Mis à jour 29 avr. 2025
  • 2 minutes de lecture
  • Établissez une connexion zéro copie à la plateforme d’analyse de données Databricks dans Concentrateur Data Fabric.

    Avant de commencer

    Vous pouvez optimiser les requêtes vers Databricks en activant les statistiques de table. Consultez votre administrateur de source de données pour confirmer si les statistiques de table sont activées dans Databricks avant d’activer cette option dans Concentrateur Data Fabric.

    Rôle requis : df_connection_admin

    Pourquoi et quand exécuter cette tâche

    Travaillez avec votre administrateur de source de données pour créer une connexion à Databricks. Pour plus d’informations sur la connexion à Databricks, reportez-vous à la section Documentation Databricks.

    Procédure

    1. Accédez aux connecteurs primaires disponibles de l’une Concentrateur Data Fabric des manières suivantes :
      • Accédez à Tous > Concentrateur Workflow Data Fabric > Connecteurs disponibles > Connecteurs primaires.
      • Accédez à Administrateur > Concentrateur Workflow Data Fabric > Connecteurs disponibles > Connecteurs primaires.
    2. Recherchez le connecteur Databricks et sélectionnez Connecter.
    3. Remplissez les champs du formulaire.
      Tableau 1. Nouveau formulaire de connexion Databricks
      Champ Description
      Nom et description
      Étiquette Connexion Nom unique de cette connexion. Cela permet d’identifier la connexion au sein de votre système.
      Nom de la connexion Nom généré par le système basé sur l’étiquette de connexion. Ce champ n’est pas modifiable une fois la connexion établie.
      Description brève Description de la connexion expliquant de quoi il s’agit.
      Attributs de connexion
      Nom du catalogue Nom du catalogue utilisé pour organiser et localiser les actifs de données dans Databricks.
      URL de connexion URL JDBC pour établir la connexion. Par exemple :

      jdbc :databricks ://<host> :<port>

      Chemin d’accès à l’entrepôt ou au calcul Entrepôt Databricks ou chemin de calcul. Par exemple :

      /sql/1.0/entrepôts/

      Activer les statistiques de table Option permettant d’activer les statistiques de table.

      Optimisez les requêtes SQL à l’aide des statistiques de table en sélectionnant cette option. L’activation des statistiques de table permet au système d’utiliser des estimations des données stockées telles que le nombre de lignes, les valeurs distinctes et la taille des données pour un traitement amélioré des requêtes.

      Remarque :
      Assurez-vous que la collecte des statistiques de table est activée dans la source de données avant de sélectionner cette option.
      Méthode d'authentification
      OAuth client ID ID client émis par Databricks pour authentification.
      Secret OAuth Clé secrète associée à l’ID client.
    4. Sélectionnez Connexion.

    Résultats

    Un test de la connexion est effectué à la source de données externe, vérifiant que les détails de connexion sont corrects et que la source de données est accessible.

    Que faire ensuite

    Si la connexion aboutit, configurez l’accès administrateur des données dans l’onglet Contrôle d’accès . Voir Gérer l’accès à une connexion établie à l’aide de rôles.

    Si la connexion échoue, vérifiez les détails de la connexion auprès de votre administrateur de source de données, puis réessayez.