Créer une connexion Databricks

  • Rversion finale: Zurich
  • Mis à jour 31 juil. 2025
  • 2 minutes de lecture
  • Établissez une connexion sans copie à la plateforme d’analyse de données Databricks dans Concentrateur Workflow Data Fabric.

    Avant de commencer

    Vous pouvez optimiser les requêtes vers Databricks en activant les statistiques de table. Consultez votre administrateur de source de données pour vérifier si les statistiques de table sont activées dans Databricks avant d’activer cette option dans Concentrateur Workflow Data Fabric.

    Rôle requis : df_connection_admin

    Pourquoi et quand exécuter cette tâche

    Travaillez avec votre administrateur de source de données pour créer une connexion à Databricks. Pour plus d’informations sur la connexion à Databricks, reportez-vous à la section Documentation Databricks.

    Procédure

    1. Accédez aux connecteurs primaires disponibles de l’une Concentrateur Workflow Data Fabric des manières suivantes :
      • Accédez à la Tous > Concentrateur Workflow Data Fabric > Connecteurs disponibles > Connecteurs primaires.
      • Accédez à la Administrateur > Concentrateur Workflow Data Fabric > Connecteurs disponibles > Connecteurs primaires.
    2. Recherchez le connecteur Databricks et sélectionnez Connecter.
    3. Remplissez les champs du formulaire.
      Tableau 1. Nouveau formulaire de connexion Databricks
      Champ Description
      Nom et description
      Étiquette Connexion Nom unique pour cette connexion. Cela permet d’identifier la connexion au sein de votre système.
      Nom de la connexion Nom généré par le système basé sur l’étiquette de connexion. Ce champ n’est pas modifiable une fois la connexion établie.
      Description brève Description de la connexion expliquant de quoi il s’agit.
      Attributs de connexion
      Nom du catalogue Nom de catalogue utilisé pour organiser et localiser les actifs de données dans Databricks.
      URL de connexion URL JDBC pour établir la connexion. Par exemple :

      jdbc :databricks ://<host> :<port>

      Chemin d’accès de l’entrepôt ou du calcul Entrepôt Databricks ou chemin de calcul. Par exemple :

      /sql/1.0/entrepôts/

      Activer les statistiques de table Option permettant d’activer les statistiques de table.

      Optimisez les requêtes SQL à l’aide des statistiques de table en sélectionnant cette option. L’activation des statistiques de table permet au système d’utiliser des estimations des données stockées telles que le nombre de lignes, les valeurs distinctes et la taille des données pour un traitement amélioré des requêtes.

      Remarque :
      Assurez-vous que la collecte des statistiques de table est activée dans la source de données avant de sélectionner cette option.
      Méthode d'authentification
      ID client OAuth ID client émis par Databricks pour authentification.
      Secret OAuth Clé secrète associée à l’ID client.
    4. Sélectionnez Connexion.

    Résultats

    Un test de la connexion est établi à la source de données externe, vérifiant que les détails de connexion sont corrects et que la source de données est accessible.

    Que faire ensuite

    Si la connexion réussit, configurez l’accès administrateur des données sous l’onglet Contrôle d’accès . Consultez Gérer l’accès à une connexion établie à l’aide de rôles.

    Si la connexion échoue, vérifiez les détails de la connexion auprès de votre administrateur de source de données et réessayez.