PowerBI メタデータコレクター
PowerBI メタデータ コレクターは、PowerBI アカウントのメタデータへの読み取り専用アクセスを提供します。
Power BI は、無関係なデータ ソースを一貫性のある、視覚的に没入型のインタラクティブな分析情報に変換するために連携するソフトウェア サービス、アプリ、コネクタのコレクションです。データソースには、Excel スプレッドシート、クラウドベースのデータウェアハウス、またはオンプレミスのハイブリッドデータウェアハウスが含まれます。Power BI を使用すると、データ ソースに接続し、重要な情報を視覚化して検出し、組織全体で分析情報を共有できます。
Power BI コレクターは、Power BI サービス ワークスペースからメタデータを収集します。収集されたメタデータを使用して、ワークスペース全体のレポートとダッシュボードを検出し、影響分析を実行して、アップストリームのデータソースへの変更が Power BI レポートにどのように影響するかを理解します。
サポートされているバージョン
コレクターは Power BI Cloud API v 1.0 をサポートしています。
サポートされている認証
- サービスプリンシパル
- ユーザーとパスワード
カタログ化されたメタデータ
Power BI コレクターは、次の情報をカタログ化します。
| オブジェクト | 収集される情報 |
|---|---|
| ワークスペース | タイトル、説明 |
| アプリケーション | タイトル、説明 |
| Power BI メジャー | タイトル、説明、非表示、式 |
| レポート | タイトル、レポートタイプ、外部 URL、埋め込み URL、プレビュー画像 (ページネーションされたレポートタイプではサポートされていません)、作成日、最終変更日、作成者、最終変更者、説明 |
| レポートページ | タイトル 注: Power BI API の制限により、サービス プリンシパル認証を使用する場合は、アプリ内のレポート ページをカタログ化できません。 |
| ダッシュボード | タイトル、外部 URL、埋め込み URL |
| ダッシュボードタイル | タイトル、埋め込み URL |
| データソース | タイトル、データソースタイプ、接続の詳細 (種類とパス) |
| セマンティックモデル | タイトル、外部 URL、説明、作成日、作成者、リフレッシュスケジュール |
| データフロー | タイトル、最終変更日、説明、作成者、スケジュールをリフレッシュ |
| Power BI テーブル (セマンティック モデルとデータフロー) | タイトル、非表示、入力済みデータ、説明、ソース式 |
| Power BI 計算テーブル | タイトル、非表示、入力済みデータ、説明、ソース式 |
| Power BI 列 | タイトル、説明、データタイプ、列タイプ、非表示、式 |
| 表形式ファイル | ファイルパス、ファイル名 |
| ファイルディレクトリ | ディレクトリパス |
| データベース | タイトル、タイプ、識別子、サーバー、ポート |
| データベーススキーマ | タイトル |
| データベーステーブル | タイトル |
| データベース列 | タイトル |
| テーブル | タイトル、説明 |
| 列 | タイトル、タイプ |
| 計算グループ | タイトル、説明 |
| 計算アイテム | タイトル、説明、式 |
オブジェクト間の関係
カタログページには、次のデータ資産タイプ間の関係が表示されます。
| データ資産ページ | 関係 |
|---|---|
| アプリケーション | レポート、ダッシュボード、ワークスペース |
| Power BI 列 | Power BI テーブル |
| データソース | セマンティックモデル、データフロー、表形式データソース (データベース、表形式ファイル) |
| タイル | ダッシュボード、レポート、セマンティックモデル |
| ダッシュボード | タイル、ワークスペース |
| ダッシュボードタイル | 関連するセマンティックモデル |
| セマンティックモデル | ダッシュボードタイル、レポート |
| レポート | タイル、ワークスペース、レポートページ (ページネーションされたレポートタイプには適用されません)、セマンティックモデル (ページネーションされたレポートタイプには適用されません)、レポート 注: Power BI では、アプリ レポートとそれに関連するワークスペース レポートは、一意のレポート ID を持つ 2 つの別々のレポートです。コレクターはそれらの間の関係をカタログ化します。 |
| レポートページ | レポート (ページネーションされたレポートタイプには適用されません) |
| セマンティックモデル | タイル、ワークスペース、レポート、テーブル、データソース、セマンティックモデル、データフロー |
| ワークスペース | レポート、セマンティックモデル、データフロー、ダッシュボード、アプリ |
| データフロー | ワークスペース、テーブル、データソース、データフロー |
| Power BI テーブル | セマンティック モデル、データフロー、Power BI 列、Power BI 測定 |
| Power BI 測定 | Power BI テーブル |
| 表形式データソース (データベース、表形式ファイル) | データソース |
| 計算グループ | Power BI テーブル |
| 計算アイテム | 計算グループ |
PowerBI のリネージ
次のリネージ情報は、Power BI コレクターによって収集されます。コレクターは、 Power BI スキャナー API を使用して、ソース テーブルと列へのリネージを確立します。スキャナー API の制限事項を必ず理解してください
| オブジェクト | 利用可能なリネージ |
|---|---|
| ダッシュボードタイル | 関連するセマンティックモデル |
| セマンティックモデル | 関連するデータフロー、セマンティックモデル |
| データフロー | データフロー |
| Power BI 列 | 列がデータのソースとなる、または値を計算する関連列。 注: リネージは、サーバー名、スキーマ名、テーブル名、またはデータベース名の代わりにパラメーターを使用する Power BI 式から収集できます。テーブル レベルおよび列レベルのリネージとカタログ リレーションシップは、Power BI API を介してテーブル、列、およびレポート間で使用できません。 |
| Power BI テーブル | テーブルのデータのソースである関連テーブル 注: 注: コレクターは、API によって返された Power BI 式を使用して、ソース列/テーブルへのリネージを解析します。 |
| Power BI 計算テーブル | 計算テーブルの値の派生元となる Power BI テーブルと列。 |
| Power BI 測定 | 測定のデータのソースである関連列 |
次の表に、サポートされているテーブル操作と変換、およびサポートされていないテーブル操作と変換を示します。これには、リネージメタデータの収集で使用されるソース式、計算列、およびメジャー式が含まれます。リストにない操作は収集されません。
| カテゴリ | カテゴリ |
|---|---|
| サポートされているパラメーター化された式 | コレクターは、フルソース、サーバーまたはホスト、ウェアハウス、データベース名、スキーマ名、テーブル名、および SQL 式の値の代わりにパラメーターを使用するソース式を解析します。 |
| サポートされているデータ関数 | Csv.Document、Excel.Workbook、File.Contents、Folder.Contents、Folder.Files、Json.Document、Odbc.DataSource、Odbc.InferOptions、Odbc.Query、Xml.Document、Web.Contents、Web.Headers、Web.BrowserContents、AmazonRedshift.Database、Sql.Database、Sql.Databases、Snowflake.Databases、PostgreSQL.Database、Databricks.Catalogs、Oracle.Database、Denodo.Contents、Databricks.Query、DatabricksMultiCloud.Catalogs、AnalysisServices.Database、GoogleBigQuery.Database |
| サポートされているテーブル関数 | Table.AddColumn, Table.AddIndexColumn, Table.RenameColumns, Table.NestedJoin, Table.ExpandTableColumn, Table.SplitColumn, Table.DuplicateColumn, Table.CombineColumns |
| サポートされていないテーブル操作 | Table.Pivot, Table.PromoteHeaders, Table.DemoteHeaders, Table.PrefixColumns, Table.TransformColumnNames, Table.Unpivot, Table.UnpivotOtherColumns, Table.AddFuzzyClusterColumn, Table.AddJoinColumn, Table.AggregateTableColumn, Table.Combine, Table.CombineColumnsToRecord, Table.ExpandRecordColumn, Table.Join, Table.Transpose |
| サポートされているデータフロー関数 | PowerPlatform.Dataflows、PowerBI.Dataflows |
| サポートされている値関数 | Value.NativeQuery |
| サポートされている計算列 | テーブル参照のある列とない列、英数字、スペース、ハイフン、アンダースコアを含む列またはテーブルを含む計算列式からのリネージがサポートされています |
| サポートされている対策 | 英数字、スペース、ハイフン、アンダースコア、周囲の引用符を含む列またはテーブルを含むメジャー式からのリネージがサポートされています |
PowerBI コレクターを実行する準備をする
コレクターを実行する前に、Azure アプリケーションの登録、認証、および権限を設定します。
始める前に
必要なロール:admin
このタスクについて
コレクターは Azure アプリケーション登録を使用し、サービスプリンシパルまたはユーザー名とパスワードの 2 つの認証方法をサポートしています。アプリケーションを登録し、認証を構成し、メタデータスキャンを有効にして、テナント ID を取得する必要があります。必要に応じて、レポート画像の収集とリネージマッピングを構成します。
手順
Power BI アプリケーションの登録
Azure にアプリケーションを登録し、Power BI コレクター認証用のクライアント資格情報を作成します。
始める前に
必要なロール:admin
Azure Active Directory にアプリケーションを登録する権限が必要です。
このタスクについて
Azure でアプリケーションを登録して、Power BI コレクター認証に必要なクライアント ID とクライアントシークレットを取得します。
手順
-
Azure で新しいアプリケーションを登録します。
-
クライアントシークレットを作成します。
-
クライアント ID を取得します。
Power BI サービスプリンシパル認証を構成する
サービスプリンシパル認証を設定して、Power BI メタデータ収集を有効にします。
始める前に
必要なロール:admin
サービスプリンシパル設定を有効にするには、Power BI 管理者である必要があります。
このタスクについて
サービスプリンシパル認証を使用する場合、コレクターはパーソナルワークスペース、ユーザーワークスペース、およびレポートページを除くすべてのオブジェクトを収集します。テナント内のすべてのアプリとワークスペースを収集するには、[テナント内のすべてのワークスペースとアプリのカタログ化] を有効にします。個人用ワークスペースとユーザーワークスペースを含めるには、ユーザーの [自分のワークスペース] のカタログコンテンツを有効にします。
手順
Power BI ユーザー名とパスワードの認証を構成する
ユーザー名とパスワードの認証の API アクセス許可を設定して、Power BI メタデータ収集を有効にします。
始める前に
必要なロール:admin
Azure Active Directory で API 権限を構成する権限が必要です。
このタスクについて
ユーザー認証を使用する場合、コレクターはパーソナルワークスペース、ユーザーワークスペース、およびレポートページを除くすべてのオブジェクトを収集します。テナント内のすべてのアプリとワークスペースを収集するには、[テナント内のすべてのワークスペースとアプリのカタログ化] を有効にします。個人用ワークスペースとユーザーワークスペースを含めるには、ユーザーの [自分のワークスペース] のカタログコンテンツを有効にします。
レポートページを収集するには、各ワークスペースへのアクセス権をユーザーに付与します。admin API にはレポートページのエンドポイントがありません。
手順
Power BI メタデータ スキャンを構成する
メタデータスキャンを有効にして、テーブルや列などの詳細なデータソース情報にアクセスします。
始める前に
必要なロール:admin
メタデータ スキャン設定を有効にするには、Power BI 管理者である必要があります。
このタスクについて
メタデータ スキャン では、Power BI 読み取り専用の管理 API を使用して、テーブルや列などの詳細なデータ ソース情報にアクセスできます。コレクターは、Power BI スキャナー API を使用して、ソース テーブルと列へのリネージを確立します。コレクターを構成する前に 、スキャナー API の制限 事項を確認してください。
手順
-
サービスプリンシパル認証の場合:
- Power BI のドキュメントに従って、Power BI 読み取り専用 API のサービスプリンシパル認証を有効にします
- メタデータスキャンの次の拡張テナント設定を有効にします。
- 詳細なメタデータでアドミン API 応答を拡張する
- DAX とマッシュアップ式を使用して管理 API 応答を拡張する
-
ユーザー名とパスワードの認証の場合は、メタデータスキャンの次の拡張テナント設定を有効にします。
重要:メタデータ スキャンを使用するには、ユーザーに管理者権限 (Microsoft 365 グローバル管理者または Power BI サービス管理者) が必要です。詳細については、 Power BI のドキュメントを参照してください。- 詳細なメタデータでアドミン API 応答を拡張する
- DAX とマッシュアップ式を使用して管理 API 応答を拡張する
Power BI テナント ID を取得
Power BI アプリケーションからテナント ID を取得します。
始める前に
必要なロール:admin
このタスクについて
テナント ID は、Power BI コレクターを構成するときに必要です。Power BI アプリケーションからこの値を取得します。
手順
Power BI レポートの画像収集を構成する
レポート画像収集を有効にして、Power BI レポートからプレビュー画像を収集します。
始める前に
必要なロール:admin
このタスクについて
レポート画像収集を有効にして、Power BI レポートからプレビュー画像を収集して、データカタログに表示します。
手順
Power BI リネージマッピングの構成
リネージ収集用のデータソースをマッピングする YAML ファイルを作成します。
始める前に
必要なロール:admin
このタスクについて
これは、リネージ情報を収集するためのオプションのタスクです。YAML ファイルを作成し、コレクターの実行時に [データソース名マッピングファイル] オプションを使用して渡します。
次のシナリオで YAML ファイルを設定します。
| シナリオ | 詳細 | アクション |
|---|---|---|
| Power BI の ODBC 接続 | ODBC 接続を使用するデータ ソースが Power BI にあります。これらのインスタンスでは、Power BI はソースのホストまたはデータベースの種類を提供しません | YAML ファイルで、DSN を特定のデータベースホストとタイプにマップします。Power BI データ ソースにデータベース名がない場合は、YAML ファイルのデータ ソースに defaultDatabaseName オプションを追加します |
| 複数のサーバー名エイリアス | 同じデータベース インスタンス (ホスト) に複数のサーバー名 (エイリアス) があり、データベース コレクターが Power BI 接続で定義されているエイリアスとは異なるエイリアスを使用する | YAML ファイルを使用して、データベースホストをユーザー指定のエイリアスにマップします |
| カスタム SQL ステートメント | カスタム SQL ステートメントは、Power BI テーブル ソース定義で使用されます。Power BI コレクターは現在、SQL ステートメントからリネージを解決するために、Snowflake、SQL Server、PostgreSQL、Redshift、Oracle、Databricks、Denodo、BigQuery のデータベースタイプへの接続をサポートしています。SQL ステートメントを使用するテーブルソースのリネージ解決では、単一の SELECT ステートメントで構成される SQL のみがサポートされます | 環境変数を使用して、datasourceKey、ホスト、および安全な認証情報を含めることにより、カスタム SQL ステートメントで指定されたデータベースを構成します |
手順
PowerBI メタデータコレクターの作成
PowerBI からメタデータをインポートするコレクターを作成します。
始める前に
開始する前に、以下を確認してください。
- コレクター用の MID サーバーがセットアップされます。詳細については、「メタデータコレクター用の MID サーバー」を参照してください。
- 要件ごとのタスクがすべて完了しました。詳細については、「PowerBI コレクターを実行する準備をする」を参照してください。
- 必要なロール:connection-admin
手順
タスクの結果
メタデータコレクターが作成され、[コネクタ] ページに [構成済み] ステータスで表示されます。これで、ソースシステムに接続してメタデータを収集する準備ができました。
次のタスク
コレクターを作成した後、次のいずれかのタスクを実行できます。
- コレクターを手動で実行して、メタデータをすぐに収集します。「メタデータコレクターを手動で実行する」を参照してください。
- 定期的なコレクターの実行をスケジュールすることで、メタデータ収集を自動化します。「メタデータコレクターの実行をスケジュール」を参照してください。
- ランタイムログを表示して、実行ステータスを監視し、問題のトラブルシューティングを行います。「コレクター実行のランタイムログの表示」を参照してください。
- データカタログで収集されたデータ資産を検出して評価します。「データカタログの管理」を参照してください。