Créer un collecteur de métadonnées Amazon Redshift

  • Rversion finale: Australia
  • Mis à jour 12 mars 2026
  • 4 minutes de lecture
  • Créez un collecteur pour importer des métadonnées à partir d’Amazon Redshift.

    Avant de commencer

    Avant de commencer, vérifiez les points suivants :

    Procédure

    1. Accédez à la Tous > Structure de données de workflow > Accueil Workflow Data Fabric.
    2. Sélectionnez l’icône du concentrateur Connect Hub dans la barre latérale gauche.
    3. Sélectionner Créer > Collecteur de métadonnées.
    4. Dans la liste Système, sélectionnez Redshift.
    5. Complétez le formulaire.
      Tableau 1. Nouveau formulaire du collecteur de métadonnées Redshift
      Champ Description
      Nom de la connexion Identificateur unique pour la connexion. Ce champ n’est pas modifiable une fois la connexion établie.
      Description brève Objet et détails de la connexion.
    6. Configurez les options d’authentification.
      Tableau 2. Options d'authentification
      Champ Description
      Nom d'utilisateur Nom d’utilisateur à utiliser pour se connecter à la base de données.
      Mot de passe Mot de passe de l’utilisateur de la base de données.
    7. Sélectionnez Collecter tous les schémas et Spécifier le schéma à collecter.
      Tableau 3. Options de collecte de schémas
      Champ Description
      Collecter tous les schémas
      Collecter tous les schémas Cataloguer tous les schémas auxquels l’utilisateur a accès.
      Exclure le schéma Nom ou expression régulière du schéma de base de données à exclure.
      Inclure le schéma d’informations Inclure le schéma d’informations de la base de données dans la collection de catalogue.
      Spécifier le schéma à collecter
      Spécifier le schéma à collecter Cataloguez uniquement les schémas spécifiés.
      Schéma Nom du schéma de base de données à cataloguer.
    8. Configurez les informations de connexion.
      Tableau 4. Information de connexion
      Champ Description
      Serveur Nom d’hôte du serveur de base de données auquel se connecter.
      Port de serveur Port du serveur de base de données (s’il ne s’agit pas du port par défaut).
      Base de données Nom de la base de données à laquelle se connecter. Spécifiez plusieurs bases de données en ajoutant une valeur par ligne.
      Base de données exclue Nom ou expression régulière indiquant les bases de données à ne pas cataloguer lorsque le champ Base de données est vide.
      Remarque :
      Ce paramètre est ignoré si le champ Base de données est spécifié.
    9. Configurez les options de périmètre et de limites de collecte.
      Tableau 5. Options relatives au champ d’application et aux limites de la collecte
      Champ Description
      Activer la collecte des statistiques de colonne Activer la collecte des statistiques de colonne (c’est-à-dire le profilage des données).
      Remarque :
      L’activation du profilage peut augmenter l’exécution du collecteur, car celui-ci doit lire les données de table pour générer des métadonnées de profilage.
      Taille d’échantillon cible pour les statistiques de colonne Nombre de lignes échantillonnées pour le calcul des statistiques de colonne et des histogrammes chaîne-valeur. Par exemple, pour échantillonner 1000 lignes, définissez le paramètre sur : 1000.

      Par défaut : 100 000

      Désactiver la collecte de traçabilité Ignorer la collecte des métadonnées de traçabilité intrabase de données.
      Désactiver la collecte de métadonnées étendue Ignorer la collecte des métadonnées étendues pour les types d’actifs de données tels que la base de données, le schéma, la table, les fonctions de colonnes, les procédures stockées, les types définis par l’utilisateur et les synonymes. Les métadonnées de base pour ces types d’actifs de données sont toujours collectées.
      Activer la collection d’exemples de valeurs de chaîne Activez la collecte d’exemples de valeurs et d’histogrammes pour les colonnes contenant des données de chaîne.
      Exclure les fonctions système Excluez les fonctions système de la collecte de métadonnées.
    10. Configurez les options de connexion et de fiabilité.
      Tableau 6. Options de connexion et de fiabilité
      Environnement de serveur Nom convivial de l’environnement dans lequel votre serveur de base de données s’exécute lorsque le nom du serveur est localhost. Elle permet de la différencier des autres environnements.
      ID de la base de données Identificateur unique de cette base de données. Utilisé pour générer l’ID de la base de données lorsque le nom de la base de données n’est pas suffisamment unique.
      Propriétés JDBC Propriétés du pilote JDBC à transmettre à la connexion du pilote.
      Délai d’expiration de l’analyse SQL Délai d’expiration en secondes pour l’analyse SQL pendant la collecte de traçabilité.

      Par défaut : 60

    11. Sélectionnez Enregistrer.

    Résultats

    Le collecteur de métadonnées est créé et apparaît sur la page Connecteurs avec un état Configuré. Il est maintenant prêt à se connecter au système source et à récolter des métadonnées.

    Que faire ensuite

    Après avoir créé le collecteur, vous pouvez effectuer l’une des tâches suivantes :