Explorer Catalogue de données
Data Catalog (Catalogue de données) est la couche de découverte en libre-service utilisée pour rechercher, évaluer et accéder aux actifs de données gouvernés.
Le catalogue de données fournit une couche de découverte et de gouvernance centralisée où les utilisateurs recherchent des actifs de données, comprennent leur traçabilité et leur qualité, et demandent l’accès aux données gouvernées dans toute l’entreprise.
Vue d’ensemble du catalogue de données
Le catalogue de données répond à un défi commun aux entreprises. Les données existent dans des dizaines de systèmes, mais trouver des actifs fiables et bien documentés nécessite une coordination manuelle entre les équipes. Le catalogue de données résout ce problème en fournissant une couche de découverte unifiée. Les collecteurs de métadonnées collectent automatiquement les métadonnées techniques, les administrateurs des données ajoutent du contexte professionnel et les consommateurs évaluent les scores de confiance et la traçabilité avant de demander l’accès.
Recherche et découverte :
Trouvez des actifs de données grâce à la recherche par mot clé, au filtrage à facettes et à la navigation par système source, domaine ou collection. La recherche porte sur les noms, les descriptions, les balises, les classifications et les termes du glossaire métier des actifs. Les résultats comprennent les scores de confiance et les indicateurs de qualité.
Détails et relations des actifs :
Affichez des détails complets pour chaque actif de données, y compris le schéma, les descriptions de champ, la propriété, les classifications des données et les relations entre les données, y compris la traçabilité.
Glossaire métier :
Créer et gérer des termes de glossaire métier qui définissent le vocabulaire des données d’entreprise. Liez les termes du glossaire aux ressources du catalogue pour fournir le contexte professionnel. Cela favorise une utilisation cohérente des définitions de données dans l’ensemble de l’organisation.
Collecteurs de métadonnées :
Analyseurs automatisés qui se connectent aux systèmes sources, découvrent les schémas et établissent des relations de lignage. Ils remplissent le catalogue de données avec des métadonnées techniques. Les collecteurs s’exécutent selon des calendriers ou sur demande pour maintenir les métadonnées du catalogue à jour à mesure que les systèmes sources évoluent.
Utilisateurs du catalogue de données
| Utilisateur | Description |
|---|---|
| Administrateur de connexion | Crée et gère les connexions à des systèmes externes et configure les collecteurs de métadonnées. Planifie les exécutions du collecteur et surveille l’exécution de la collecte et les journaux. |
| Administrateur des données | Enrichit les ressources du catalogue avec le contexte professionnel et crée et gère les termes du glossaire métier. Relie les termes aux actifs, attribue la propriété, gère les balises et les classifications, organise les actifs en domaines et collections et suit l’état du cycle de vie des actifs. |
| Visionneuse de catalogue | Recherche et parcourt le catalogue de données pour découvrir les actifs de données. Affiche les détails et la traçabilité des actifs, évalue les scores de confiance et les indicateurs de qualité, prévisualise les exemples de données et identifie les actifs à utiliser dans les analyses, les workflows ou les applications d’IA. |
Workflow du catalogue de données
Ce cycle de vie présente les différentes phases de découverte, de gouvernance et de consommation dans le catalogue de données :
- Connect : les administrateurs de connexion créent des connexions à des sources de données externes et configurent des collecteurs de métadonnées. Ceux-ci récoltent des métadonnées techniques, notamment des schémas, des tables, des colonnes, des relations et une traçabilité.
- Récolte : les collecteurs de métadonnées s’exécutent selon des calendriers ou sur demande pour détecter les actifs et établir des relations de traçabilité. Ils remplissent le catalogue avec des métadonnées techniques à jour provenant de systèmes sources connectés.
- Enrichir : les administrateurs des données ajoutent du contexte métier en créant des termes de glossaire, en liant des termes aux ressources, en ajoutant des descriptions, en attribuant la propriété, en appliquant des classifications et en organisant les ressources en domaines et collections
- Découvrir : les visionneurs de catalogues recherchent et parcourent pour trouver des actifs de données pertinents. Ils examinent les métadonnées et la traçabilité, évaluent les scores de confiance, prévisualisent les exemples de données et identifient les actifs qui répondent à leurs besoins.
- Accès : les utilisateurs demandent l’accès aux actifs découverts via des workflows de gouvernance. Après approbation, ils consomment des données gouvernées via des tables Data Fabric, des API, des tableaux de bord d’analyse ou des agents IA.
Avantages du catalogue de données
| Avantage | Fonctionnalité | Utilisateurs |
|---|---|---|
| Rechercher des actifs de données dans les systèmes de l’entreprise sans coordination manuelle | Rechercher, parcourir, filtrage par facettes | Tous les utilisateurs |
| Comprendre la qualité et la fiabilité des données avant de demander l’accès | Scores de confiance, indicateurs de qualité, aperçu des données d’échantillon | Visionneuse de catalogue |
| Détecter et cataloguer automatiquement les métadonnées à mesure que les systèmes sources évoluent | Collecteurs de métadonnées, collecte planifiée | Administrateur de connexion |
| Fournir le contexte professionnel et le vocabulaire partagé pour les données d’entreprise | Termes du glossaire métier, descriptions des ressources | Administrateur des données |
| Organiser et classer les actifs pour améliorer la découvrabilité et la gouvernance | Domaines, collections, balises, classifications | Administrateur des données |
| Établir la responsabilité par des affectations de propriété et d’intendance | Affectation propriétaire et intendant, gestion du cycle de vie | Administrateur des données |
Ce qu'il faut explorer ensuite
Pour en savoir plus sur l’utilisation du catalogue de données, consultez :