Bereiten Sie die Ausführung des Databrick-Sammlers vor

  • Freigeben Version: Australia
  • Aktualisiert 12. März 2026
  • 3 Minuten Lesedauer
  • Schließen Sie Authentifizierungs- und Berechtigungskonfigurationsaufgaben ab, bevor Sie den Metadatensammler „Databricks“ ausführen.

    Vorbereitungen

    Erforderliche Rolle: Administrator

    Prozedur

    1. Generieren Sie Anmeldeinformationen für Datenabschnitte.

      Detaillierte Anweisungen hierzu finden Sie unter Generieren Sie Anmeldeinformationen.

    2. Konfigurieren Sie Berechtigungen.

      Detaillierte Anweisungen hierzu finden Sie unter Konfigurieren Sie Berechtigungen.

    Generieren Sie Anmeldeinformationen

    Generieren Sie ein persönliches Zugriffstoken oder einen geheimen Serviceprinzip, um die Databricks-Verbindung zu authentifizieren.

    Vorbereitungen

    Erforderliche Rolle: Account-Administrator

    Wichtig:
    Sie müssen ein Account-Administrator in Databricks sein, um Service-Prinzipale zu erstellen und zu verwalten.

    Warum und wann dieser Vorgang ausgeführt wird

    Konfigurieren Sie diese Anmeldeinformationen, um die Authentifizierung für den Databricks-Sammler zu aktivieren. Sie können entweder ein persönliches Zugriffstoken (PAT) oder einen OAuth-Serviceprinzipal verwenden.

    Prozedur

    Generieren Sie die erforderlichen Anmeldeinformationen basierend auf Ihrer Authentifizierungsmethode.
    • So generieren Sie ein persönliches Zugriffstoken (PAT):

      1. Wählen Sie im Arbeitsbereich „Datenabschnitte“ in der oberen Leiste Ihren Anwendernamen aus, und wählen Sie aus Einstellungen .
      2. Wählen Sie Aus Entwickler .
      3. Neben Zugriffstoken , Auswählen Verwalten .
      4. Wählen Sie Aus Neues Token Generieren .
      5. Geben Sie einen Kommentar ein, um das Token zu identifizieren.
      6. Ändern Sie Lebensdauer (Tage) Einstellung, falls erforderlich.
        Hinweis:
        Lassen Sie das Feld „Lebensdauer“ leer, um ein Token mit einer maximalen Lebensdauer von 730 Tagen zu erstellen.
      7. Wählen Sie Aus Generieren .
      8. Kopieren Sie das angezeigte Token, und wählen Sie aus Fertig . Speichern Sie dieses Token sicher für die zukünftige Verwendung.
      9. Alternativ können Sie verwenden Token-API Dient zum Generieren einer PAT.
    • So generieren Sie ein geheimes Serviceprinzipalgeheimnis:

      1. Wählen Sie im Arbeitsbereich „Datenabschnitte“ in der oberen Leiste Ihren Anwendernamen aus, und wählen Sie aus Einstellungen .
      2. Navigieren Sie zu Identität und Zugriff Registerkarte.
      3. Neben Service-Prinzipale , Auswählen Verwalten .
      4. Wählen Sie Aus Service-Prinzipal hinzufügen .
      5. Wählen Sie Aus Fügen Sie neu hinzu , Geben Sie einen Namen für den Service-Prinzipal an, und wählen Sie aus Hinzufügen .
      6. Wählen Sie den neu erstellten Service-Prinzipal aus, und navigieren Sie zu Geheimnisse Registerkarte.
      7. Wählen Sie Aus Geheimnis generieren .
      8. Geben Sie die Lebensdauer für das Geheimnis ein, und wählen Sie aus Generieren .
      9. Kopieren Sie Client-ID Und Geheimer Client Aus dem Dialogfeld.

    Konfigurieren Sie Berechtigungen

    Gewähren Sie erforderliche Berechtigungen für Unity-Katalog, Aufträge und Systemtabellen.

    Vorbereitungen

    Erforderliche Rolle: Administrator

    Warum und wann dieser Vorgang ausgeführt wird

    Im Unity-Katalog sind Daten standardmäßig sicher. Gewähren Sie dem Anwender, der den Sammler ausführt, Berechtigungen zum Sammeln von Ressourcen. Sicherbare Objekte im Unity-Katalog sind hierarchisch, und Berechtigungen werden nach unten geerbt.

    Prozedur

    1. Gewähren Sie Unity-Katalogberechtigungen.
      Der Anwender benötigt KATALOG VERWENDEN , SCHEMA VERWENDEN , Und WÄHLEN SIE AUS Berechtigungen für den Katalog für den Zugriff auf Daten.
      Hinweis:
      Ein Anwender mit KATALOG VERWENDEN Und DURCHSUCHEN Berechtigungen können auf Daten zugreifen, aber keine Spaltenstatistiken, Systemfunktionen oder bestimmte zusätzliche Tabellenmetadaten abrufen. Siehe Dokumentation zu Databricks Für Details zu diesen Berechtigungen.
      1. Wählen Sie den Katalog aus, auf den Sie Zugriff gewähren möchten.
      2. Wählen Sie aus Berechtigungen Registerkarte und wählen Sie aus Gewähren .
      3. Wählen Sie den Anwender und die entsprechenden Berechtigungen aus, und wählen Sie dann aus Gewähren .
    2. Gewähren Sie Berechtigungen für Rechenressourcen.
      Der Anwender muss haben Kann Verwendet Werden Berechtigung für den vorhandenen Cluster oder das vorhandene SQL-Warehouse oder kann eigene Rechenressourcen erstellen.
      1. Wählen Sie aus Weitere Optionen Symbol in der Ressource, und wählen Sie aus Berechtigungen .
      2. Fügen Sie den Anwender hinzu, und wählen Sie aus Kann Verwendet Werden Berechtigung.
    3. Gewähren Sie Berechtigungen für Aufträge.
      Zum Sammeln von Aufträgen muss der Anwender, der den Sammler ausführt, über verfügen Kann Anzeigen Berechtigungen für die Zielaufträge. Details zum Festlegen von Auftragsberechtigungen finden Sie unter Dokumentation zu Databricks .
    4. Aktivieren Sie das Sammeln von Herkunft aus Systemtabellen.
      Arbeiten Sie mit Ihrem Databricks-Administrator zusammen, um zu aktivieren System.Zugriff Schema.
      1. Stellen Sie eine PUT-Anforderung an die API, um das Schema zu aktivieren.
        curl -X PUT -H "Authorization: Bearer <PAT_Token>" https://<databricks-host>/api/2.1/unity-catalog/metastores/<metastore_id>/systemschemas/access

        Um zu finden Metastore_ID , Navigieren Sie zu Katalog > Einstellungen Und zeigen Sie den Abschnitt „Metastore-Informationen“ an.

      2. Gewähren Sie dem Anwender, der den Sammler ausführt, die folgenden Berechtigungen.
        • SCHEMA VERWENDEN Ein System.Zugriff
        • WÄHLEN SIE AUS Ein System.Access.table_lineage
        • WÄHLEN SIE AUS Ein System.Access.column_lineage

        Beispiel-SQL-Befehle:

        GRANT USE SCHEMA ON SCHEMA system.access to `<userid>`;
                   GRANT SELECT on TABLE system.access.table_lineage to `<userid>`;
                   GRANT SELECT on TABLE system.access.column_lineage to `<userid>`;