Collecteur de métadonnées PostgreSQL

  • Rversion finale: Australia
  • Mis à jour 12 mars 2026
  • 2 minutes de lecture
  • Fournit un accès en lecture seule aux métadonnées à partir d’une base de données PostgreSQL.

    Le collecteur collecte les métadonnées pour les tables et colonnes PostgreSQL, les rendant consultables et détectables dans le catalogue de données. Prend en charge à la fois les instances PostgreSQL auto-hébergées et les instances PostgreSQL gérées, telles que celles hébergées sur AWS RDS.

    Authentification prise en charge

    Authentification par nom d’utilisateur et mot de passe et authentification AWS IAM.

    Métadonnées cataloguées

    Le collecteur PostgreSQL répertorie les informations suivantes.

    Remarque :
    Toutes les versions des fonctions surchargées et des procédures stockées sont cataloguées. Chaque version a son propre titre dans le catalogue mais un identifiant distinct.
    Tableau 1. Métadonnées cataloguées
    Objet Informations cataloguées
    Colonnes Nom, Description, Type JDBC, Type de colonne, Peut être null, Valeur par défaut, Type de clé (primaire, étrangère), taille de colonne, index de colonne
    Table Nom, description, clé primaire, schéma
    Index de table Cardinalité de l’index, Nom de colonne, Type d’index, Nom d’index, n’est pas unique, Position ordinale, Pages, Séquence de tri
    Vues Nom, description, définition SQL
    Vue matérialisée Nom, description, définition SQL
    Schéma Identificateur, nom
    Base de données Type, nom, identificateur, serveur, port, environnement, URL JDBC
    Fonction Nom, description, type de fonction
    Procédure stockée Nom, description, type de procédure stockée
    Lorsque les paramètres de profilage et d’échantillonnage sont activés, les informations supplémentaires de colonne suivantes sont cataloguées :
    Remarque :
    L’utilisateur/rôle doit avoir un accès en lecture aux données pour pouvoir collecter des informations de profilage (statistiques de colonne).
    Tableau 2. Informations spécifiques au profilage et à l’échantillonnage
    Objet Informations cataloguées
    Colonne
    • Longueur moyenne (échantillon)
    • Valeur moyenne (échantillon)
    • Distribution des données
    • Valeurs distinctes
    • Valeurs distinctes estimées
    • Valeurs non nulles estimées
    • Longueur maximale (échantillon)
    • Valeur maximale (échantillon) triée par ordre numérique ou alphabétique (z à a)
    • Longueur minimale (échantillon)
    • Valeur minimale (échantillon), triée par ordre numérique ou alphabétique (de A à Z)
    • Valeurs non nulles (échantillon)
    • Exemple de valeurs de chaîne (5 premiers éléments d’une colonne)
    Table
    • Nombre de lignes
    • Nombre d’échantillons (taille d’échantillon cible)

    Relations entre les objets

    Les pages de catalogue affichent les relations entre les types de ressources de données suivants :

    Tableau 3. Relations entre les pages des actifs de données collectées
    Page Actifs de données Relation
    Table Colonnes, index de table
    Colonnes Table
    Schéma
    • Base de données contenant le schéma
    • Table faisant partie du schéma
    • Vue faisant partie du schéma
    • Vue matérialisée faisant partie du schéma
    Vue
    • Schéma contenant des vues
    • Colonnes faisant partie des vues
    Vue matérialisée
    • Schéma contenant des vues matérialisées
    • Colonnes faisant partie des vues matérialisées

    Traçabilité pour PostgreSQL

    Le collecteur identifie la traçabilité au niveau des colonnes pour les vues et les vues matérialisées, en traçant les sources de données des colonnes de la vue aux colonnes de la table source dans les expressions et sous-requêtes SQL.

    Établit des relations entre les vues et les colonnes de table source qui :

    • Trier les lignes (SQL TRIER PAR)
    • Lignes de filtre (clauses SQL WHERE et HAVING)
    • Lignes d’agrégat (SQL GROUP BY)
    Remarque :
    Les relations d’affichage à table peuvent être établies de manière transitive par le biais de relations au niveau des colonnes. La traçabilité des relevés variables n’est pas prise en charge.