Metadatensammler für Databricks
Der Metadatensammler für Databricks bietet schreibgeschützten Zugriff auf Metadaten aus einem externen Databricks-Account.
Der Sammler sammelt Metadaten aus Daten-Assets in Datenabschnitten-Hive-Metadaten, Unity-Katalog (einschließlich Delta Lake), Workflows und Notebooks.
Metadaten katalogisiert
Der Databricks-Sammler katalogisiert die folgenden Informationen.
| Objekt | Informationen katalogisiert |
|---|---|
| Spalten |
Name, Beschreibung, JDBC-Typ, Spaltentyp, ist auf Null setzbar, Standardwert, Spaltengröße, Spaltenindex Erweiterte Metadaten: Tags Hinweis:
Veraltete Spalten und alle Herkunft im Zusammenhang mit diesen veralteten Spalten werden nicht katalogisiert. |
| Tabelle |
Name, Beschreibung, Schema, primärer Schlüssel, Fremdschlüssel Erweiterte Metadaten: Tags, Besitzer, Typ, Erstellungsdatum, zuletzt geändert, Standort, Anbieter, Version, Größe, Dateianzahl, Partitionsspalten, Eigenschaften |
| Modell |
Name, Besitzer, Beschreibung, Erstellt Von, Erstellt Am, Zuletzt Geändert Von, Zuletzt Geändert Um, Sicherbare Art, Sicherbarer Typ |
| Ansichten |
Name, Beschreibung, SQL-Definition, Tags |
| Schema |
Name Erweiterte Metadaten: Tags |
| Datenbank |
Typ, Name, Server, Port, Umgebung, JDBC-URL Erweiterte Metadaten: Tags |
| Notebook |
Notebook-ID, Pfad, Sprachtyp (SQL, Python, Skala, R) |
| Funktion |
Name, Beschreibung, Funktionstyp |
| Auftrag |
Titel, Beschreibung, Ersteller, erstellt am, Auftrag ausgeführt als, Format, max. gleichzeitige Ausführungen, Benachrichtigung beim Start, Zeitüberschreitungen (Sek.), Benachrichtigung bei Erfolg, Zeitplan, Git-Quelle, Benachrichtigung bei Fehler, Tags, Liste der Aufgaben, Liste der Cluster |
| Cluster |
Name, Beschreibung, Knotentyp-ID, Treiber-Knotentyp-ID, Funkenversion, Anzahl der Mitarbeiter, automatische Skalierung der max. Worker, automatische Skalierung der Min. Worker, AWS-Attribute, Tags |
| Aufgabe |
Aufgabenschlüssel, Typ der Aufgabe (Notebook, dbt, Funktions-JAR, Python-Skript, Python-Rad, Pipeline-Aufgabe, SQL), Aufgabenzeitüberschreitung, Wiederholungsintervall, von der Aufgabe verwendetes Cluster, Max. Wiederholungen, abhängig von, Bibliotheken, Benachrichtigungen (beim Start, bei Erfolg, bei Fehler), Notizbuchdateipfad, Notizbuchquelle, Notizbuchparameter, Hauptklassenname der Funkenjar, Funkenjar-Parameter, Python-Skriptdateipfad, Python-Skriptparameter, Funkenübermittlungsparameter, Pipeline-ID, vollständige Aktualisierung der Pipeline, Python-Rad-Paketname, Python-Rad-Einstiegspunkt, Python-Rad-Parameter, SQL-Lager, SQL-Abfrage-ID, SQL-Dashboard-ID, SQL-Warnungs-ID, DBT-Projektverzeichnis, DBT-Profilverzeichnis, DBT-Lager, DBT-Katalog, DBT-Schema, DBT-Befehle |
| Externer Standort |
Name, externe URL, Beschreibung, Datenquellentyp, Erstellungsdatum, Erstellt Von, Besitzer |
| Speicher-Anmeldeinformationen |
Name, Beschreibung, Anmeldeinformationen, Erstellungsdatum, Erstellt Von, Besitzer |
| Volumen |
Name, Beschreibung, Typ, Besitzer, Erstellt Von, erstellt am, zuletzt geändert von, zuletzt geändert am, Metastore-ID |
| Materialisierte Ansicht |
Name, SQL-Definition, erstellt, zuletzt geändert |
| Metrikansicht |
Name, Beschreibung, YAML-Definition, Quelltabelle, Quelltabellentyp, Filter, Erstellt, Zuletzt Geändert |
Beziehungen zwischen Objekten
Die gesammelten Metadaten enthalten Katalogseiten für die folgenden Daten-Asset-Typen. Jede Katalogseite hat eine Beziehung zu den anderen zugehörigen Daten-Asset-Typen.
| Daten-Asset-Seite | Beziehungen |
|---|---|
| Tabelle |
Spalten in Tabelle |
| Schema |
|
| Datenbank | Schema in Datenbank |
| Spalten | Tabelle mit Spalte |
| Auftrag |
|
| Cluster |
|
| Aufgabe |
|
| Notebook |
|
| Ordner |
|
| Externer Standort |
|
| Speicher-Anmeldeinformationen | Wird von externem Standort verwendet |
| Modell |
|
| Volumen |
|
| Materialisierte Ansicht |
|
| Metrikansicht |
|
Herkunft für Datenabschnitte
Die folgenden Abstammungsinformationen werden vom Databricks-Sammler erfasst.
| Objekt | Herkunft verfügbar |
|---|---|
| Spalte in der Ansicht | Der Sammler identifiziert die zugeordnete Spalte in einer vorgelagerten Ansicht oder Tabelle für Hive-Metastore und Einheitskatalog:
Hinweis: Veraltete Spalten und alle Herkunft im Zusammenhang mit diesen veralteten Spalten werden nicht katalogisiert. |
| Notebook | Aufgaben, die auf das Notebook verweisen. (Nur, wenn „Einheitskatalog für Databricks“ aktiviert ist). |
| Tabelle |
|
Authentifizierung unterstützt
Der Databricks-Sammler unterstützt die Authentifizierung des persönlichen Zugriffstoken und die Authentifizierung des OAuth-Serviceprinzials.