Erstellen Sie einen Snowflake-Metadatensammler
Erstellen Sie einen Sammler, um Metadaten aus Snowflake zu importieren.
Vorbereitungen
Bevor Sie beginnen, überprüfen Sie Folgendes:
- Für die Sammler ist ein MID-Server eingerichtet. Weitere Informationen finden Sie unter MID-Server für Metadatensammler.
- Alle erforderlichen Aufgaben sind abgeschlossen. Weitere Informationen finden Sie unter Bereiten Sie die Ausführung des Snowflake-Sammlers vor.
- Erforderliche Rolle: Connection-admin
Prozedur
- Navigieren zu Alle > Workflow-Datafabric > Workflow-Datafabric-Startseitean.
-
Wählen Sie den Connect Hub aus
Symbol in der linken Sidebar.
- Auswählen Erstellen > Metadatensammleran.
- Wählen Sie in der Liste System die Option aus Schneeflocke .
-
Füllen Sie das Formular aus.
Tabelle : 1. Neues Snowflake-Metadatensammlerformular Feld Beschreibung Verbindungsname Eindeutiger Bezeichner für die Verbindung. Dieses Feld kann nicht geändert werden, sobald die Verbindung hergestellt wurde. Kurzbeschreibung Zweck und Details der Verbindung. -
Konfigurieren Sie die Authentifizierungsoptionen.
Tabelle : 2. Authentifizierungsoptionen Feld Beschreibung Authentifizieren Sie sich mit Anwendername und Passwort Anwendername Anwendername, der zum Herstellen der JDBC-Verbindung verwendet werden soll. Passwort Passwort des Anwenders. Authentifizieren Sie sich mit einem privaten Schlüssel Anwendername Anwendername, der zum Herstellen der JDBC-Verbindung verwendet werden soll. Private Schneefloke-Schlüsseldatei Laden Sie die private Schlüsseldatei hoch, die für die Authentifizierung verwendet werden soll. Passwort der privaten Schlüsseldatei Passwort für die private Schlüsseldatei, wenn der Schlüssel verschlüsselt und ein Passwort festgelegt ist. -
Wählen Sie aus Erfassen Sie alle Schemas Und Geben Sie an, welches Schema erfasst werden soll .
Tabelle : 3. Schemasammlungsoptionen Feld Beschreibung Erfassen Sie alle Schemas Erfassen Sie alle Schemas Katalogisieren Sie alle Schemas, auf die der Anwender Zugriff hat. Schema Ausschließen Name oder regulärer Ausdruck des auszuschließenden Datenbankschemas. Informationsschema Einschließen Fügen Sie das Informationsschema der Datenbank in die Katalogsammlung ein. Geben Sie an, welches Schema erfasst werden soll Geben Sie an, welches Schema erfasst werden soll Katalog nur die angegebenen Schemas. Schema Name des Datenbankschemas für den Katalog. -
Geben Sie die Snowflake-Verbindungsdetails ein.
Tabelle : 4. Verbindungsdetails Feld Beschreibung Server Hostname des Datenbankservers, mit dem eine Verbindung hergestellt werden soll. Serverport Port des Datenbankservers (wenn nicht der Standard). Datenbank Name der Datenbank, mit der eine Verbindung hergestellt werden soll. Geben Sie mehrere Datenbanken an, indem Sie einen Wert pro Zeile hinzufügen. Snowflake-Rolle Die Rolle, die zum Ausführen der Abfrage verwendet wird. Ausgeschlossene Datenbank Name oder regulärer Ausdruck, der angibt, dass Datenbanken nicht in den Katalog aufgenommen werden, wenn das Feld „Datenbank“ leer ist. Hinweis:Dieser Parameter wird ignoriert, wenn das Feld „Datenbank“ angegeben ist. -
Konfigurieren Sie die Statistiken und Stichprobenoptionen.
Tabelle : 5. Erfassungsbereich und Herkunftsoptionen Feld Beschreibung Erfassen Sie Informationen Zur Datenmetrikfunktion Option zum Sammeln von Metadaten zu Datenmetrikfunktionen und ihren Zuordnungen zu Tabellen. Beobachtungsanzahl Der Datenmetrik Anzahl der neuesten zu erfassenden Datenmetrikbeobachtungen. Ignoriert, es sei denn, die Funktion „Informationen zur Datenmetrik erfassen“ ist aktiviert. Standard: 1
Aktivieren Sie die Sammlung von Spaltenstatistiken Option zum Sammeln von Spaltenstatistiken, d. h. Datenprofilierung. Hinweis:Das Aktivieren dieser Option kann die Laufzeit des Sammlers verlängern, da der Sammler Tabellendaten liest, um Profilerstellungsmetadaten zu sammeln.Zielstichprobengröße für Spaltenstatistiken Anzahl der Zeilen, die für die Berechnung von Spaltenstatistiken und Zeichenfolgenwert-Histogrammen als Stichproben erfasst wurden. Legen Sie beispielsweise den Wert auf 1000 fest, um 1000 Zeilen als Beispiel zu verwenden. Standard: 100000
Hinweis:Gilt nur, wenn „Erfassung von Spaltenstatistiken aktivieren“ aktiviert ist.Sammeln Sie Nutzungsinformationen Für Die Snowflake-Tabelle Option zum Sammeln von Metadaten zur Nutzung der Snowflake-Tabelle in Abfragen, einschließlich Popularität. Berechnet für jede Tabelle in der Datenbank den Prozentsatz der Tabellen, die nicht weniger Mal abgefragt wurden als die Betrefftabelle. Suche In Tagen Für Tabellennutzung Anzahl der Tage in der Vergangenheit, ab denen mit dem Sammeln der Tabellennutzung begonnen werden soll. Standard: 7 Tage
Deaktivieren Sie die Herkunftssammlung Option zum Überspringen der Erfassung von Metadaten für die Datenbankherkunft. Deaktivieren Sie die erweiterte Metadatensammlung Option zum Überspringen der Erfassung erweiterter Metadaten für Daten-Asset-Typen wie Datenbank, Schema, Tabelle, Spalten, Funktionen, gespeicherte Verfahren, anwenderdefinierte Typen und Synonyme. Basismetadaten für diese Daten-Asset-Typen werden noch erfasst. -
Konfigurieren Sie den Erfassungsbereich und die Begrenzungsoptionen.
Tabelle : 6. Optionen für Erfassungsumfang und -Grenzen Feld Beschreibung Erfassen Sie Snowflake-Tag-Informationen Option zum Sammeln von Metadaten zu Snowflake-Tags in oder, die der in der Datenbankeinstellung angegebenen Datenbank zugeordnet sind. Erfassen Sie Alle Snowflake-Tag-Informationen Option zum Sammeln von Metadaten zu Snowflake-Tags unabhängig von der Datenbank, in der sie sich befinden. Sammeln Sie Snowflake-Richtlinieninformationen Option zum Sammeln von Metadaten zu Snowflake-Maskierung und Zeilenzugriffsrichtlinien in oder zugeordnet zu der in der Datenbankeinstellung angegebenen Datenbank. Erfassen Sie Alle Snowflake-Richtlinieninformationen Option zum Sammeln von Metadaten zu Snowflake-Maskierung und Zeilenzugriffsrichtlinien unabhängig von der Datenbank, in der sie sich befinden. Sammeln Sie Streamlit-App-Informationen Option zum Sammeln von Metadaten zu Snowflake-Streamlit-Anwendungen. Aktivieren Sie die Sammlung von Beispielzeichenfolgenwerten Option zum Sammeln von Beispielwerten und Histogrammen für Spalten mit Zeichenfolgendaten. Hinweis:Gilt nur, wenn „Erfassung von Spaltenstatistiken aktivieren“ aktiviert ist.Schließen Sie Systemfunktionen aus Option zum Ausschließen integrierter Systemfunktionen vom Sammeln. -
Konfigurieren Sie die Verbindungs- und Zuverlässigkeitsoptionen.
Tabelle : 7. Verbindungs- und Zuverlässigkeitsoptionen Feld Beschreibung Snowflake-Lager Snowflake-Lager, das beim Herstellen einer Verbindung verwendet werden soll. Standard: Zugewiesenes Standardlager des Anwenders
Serverumgebung Anzeigename für die Umgebung, in der Ihr Datenbankserver ausgeführt wird. Nützlich, wenn der Servername localhost ist und Sie ihn von anderen Umgebungen unterscheiden müssen. Datenbank-ID Eindeutiger Bezeichner für diese Datenbank, der zum Generieren der Datenbank-ID verwendet wird, wenn der Datenbankname nicht eindeutig genug ist. JDBC-Eigenschaften JDBC-Treibereigenschaften, die an die Treiberverbindung übergeben wurden. Zeitüberschreitung bei SQL-Analyse Zeitüberschreitung in Sekunden für SQL-Analyse während der Abstammungssammlung. Standard: 60
- Wählen Sie Speichern.
Ergebnisse
Der Metadatensammler wird erstellt und wird auf der Seite „Connectors“ mit einem konfigurierten Status angezeigt. Sie ist jetzt bereit, eine Verbindung zum Quellsystem herzustellen und Metadaten zu sammeln.
Nächste Maßnahme
Nach dem Erstellen des Sammlers können Sie eine der folgenden Aufgaben ausführen:
- Führen Sie den Sammler manuell aus, um Metadaten sofort zu sammeln. Weitere Informationen finden Sie unter Führen Sie Metadatensammler manuell aus.
- Automatisieren Sie die Metadatensammlung, indem Sie regelmäßige Sammlerausführungen planen. Weitere Informationen finden Sie unter Metadaten-Sammlerausführungen planen.
- Überwachen Sie den Ausführungsstatus, und beheben Sie Probleme, indem Sie die Laufzeitprotokolle anzeigen. Weitere Informationen finden Sie unter Zeigen Sie Laufzeitprotokolle für Sammlerausführungen an.
- Erkennen und bewerten Sie die gesammelten Daten-Assets im Datenkatalog. Weitere Informationen finden Sie unter Steuert Datenkatalog.