Oracle メタデータコレクターの作成
Oracle からメタデータをインポートするコレクターを作成します。
始める前に
開始する前に、以下を確認してください。
- コレクター用の MID サーバーがセットアップされます。詳細については、「メタデータコレクター用の MID サーバー」を参照してください。
- 要件ごとのタスクがすべて完了しました。詳細については、「Oracle コレクターの実行を準備する」を参照してください。
- 必要なロール:connection-admin
手順
- 移動先 すべて > ワークフローデータファブリック > Workflow Data Fabric ホーム.
-
左側のサイドバーで [コネクトハブ]
を選択します。
- 選択 作成 > メタデータコレクター.
- [システム] リストから [Oracle] を選択します。
-
フォームに入力します。
表 : 1. 新規 Microsoft SQL Server メタデータコレクターフォーム フィールド 説明 接続名 接続の一意の識別子。接続が確立されると、このフィールドは変更できません。 簡単な説明 接続の目的と詳細。 -
認証オプションを設定します。
表 : 2. 認証オプション フィールド 説明 ユーザー名 データベースへの接続に使用するユーザー名。 パスワード データベースユーザーのパスワード。 -
[ すべてのスキーマを収集 ] または [収集するスキーマを指定 ] から選択して、スキーマ収集オプションを構成します。
表 : 3. スキーマ収集オプション フィールド 説明 すべてのスキーマを収集 すべてのスキーマを収集 ユーザーがアクセスできるすべてのスキーマをカタログ化します。 スキーマを除外 除外するデータベーススキーマの名前または正規表現。 情報スキーマを含める データベースの情報スキーマをカタログコレクションに含めます。 収集するスキーマを指定 収集するスキーマを指定 指定されたスキーマのみをカタログ化します。 スキーマ カタログするデータベーススキーマの名前。 -
接続情報を構成します。
表 : 4. 接続情報 フィールド 説明 サーバー 接続するデータベースサーバーのホスト名。 サーバーポート データベースサーバーのポート (デフォルトでない場合)。 データベース 接続するデータベースの名前。1 行に 1 つの値を追加して、複数のデータベースを指定します。指定しない場合、コレクターはすべてのデータベースからメタデータを収集します。 除外データベース [データベース] フィールドが空の場合にデータベースをカタログ化しないことを示す名前または正規表現。 注:[データベース] フィールドが指定されている場合、このパラメーターは無視されます。 -
統計情報とサンプリングオプションを設定します。
表 : 5. 統計情報とサンプリングオプション フィールド 説明 列統計情報の収集を有効にする 列統計情報の収集 (つまり、データプロファイリング) を有効にします。 注:プロファイリングを有効にすると、コレクターはプロファイリングメタデータを生成するためにテーブルデータを読み取る必要があるため、コレクターの実行時間が長くなる可能性があります。列統計のターゲットサンプルサイズ 列の統計情報と文字列値ヒストグラムの計算のためにサンプリングされた行数。たとえば、1000 行をサンプリングするには、パラメーターを 1000 に設定します。 デフォルト:100000
リネージ収集を無効にする データベース内リネージメタデータの収集をスキップします。 拡張メタデータ収集を無効にする データベース、スキーマ、テーブル、列関数、ストアドプロシージャ、ユーザー定義型、同義語などのデータ資産タイプの拡張メタデータの収集をスキップします。これらのデータ資産タイプの基本メタデータは引き続き収集されます。 -
収集スコープと制限オプションを構成します。
表 : 6. 収集スコープと制限オプション フィールド 説明 データベースは Oracle SID です データベースが実際には Oracle SID であることを示します。 Oracle JDBC 接続タイムゾーン JVM のデフォルトタイムゾーンを Oracle JDBC 接続タイムゾーンとして使用するかどうかを指定します。 サンプル文字列値の収集を有効にする 文字列データを含む列のサンプル値とヒストグラムの収集を有効にします。 システム機能を除外 メタデータ収集からシステム関数を除外します。 -
接続と信頼性のオプションを構成します。
表 : 7. 接続と信頼性のオプション フィールド 説明 サーバー環境 サーバー名が localhost の場合に、データベースサーバーが実行される環境の分かりやすい名前です。他の環境との差別化に役立ちます。 データベース ID このデータベースの一意の識別子。データベース名が十分に一意でない場合にデータベース ID を生成するために使用されます。 Oracle Autonomous Database の使用 Autonomous Database に接続するオプション。 このオプションを有効にすると、次のようになります。
- データベースパラメーターの値としてサービス名を入力します。たとえば、g0404_ktest_high.adb.oraclecloud.com
- サーバーパラメーターの値としてホスト名を入力します。たとえば、adb.us-chicago-1.oraclecloud.com
Oracle Autonomous Database 接続文字列 Autonomous Database の接続文字列。接続文字列は、jdbc:oracle:thin:@<host>:<port>/<service_name> または jdbc:oracle:thin:@(address=(protocol=tcps)(port=<port>) (host:<host>))(connect_data=(service_name=<service_name>))(security=(ssl_server_dn_match=yes))の形式にする必要があります。 注:コレクタは、「Oracle Autonomous Database接続文字列」フィールドの値を使用してOracle Cloudインスタンスに接続します。ただし、サーバー、ポート、およびデータベースのパラメーターは引き続き必要であり、IRI の製造に使用され、カタログ内のデータベースデータ資産を一意に識別します。JDBC プロパティ ドライバー接続に渡す JDBC ドライバープロパティ。 SQL 解析タイムアウト リネージ収集中の SQL 解析のタイムアウト (秒)。 デフォルト:60
- [Save (保存)] を選択します。
タスクの結果
メタデータコレクターが作成され、[コネクタ] ページに [構成済み] ステータスで表示されます。これで、ソースシステムに接続してメタデータを収集する準備ができました。
次のタスク
コレクターを作成した後、次のいずれかのタスクを実行できます。
- コレクターを手動で実行して、メタデータをすぐに収集します。「メタデータコレクターを手動で実行する」を参照してください。
- 定期的なコレクターの実行をスケジュールすることで、メタデータ収集を自動化します。「メタデータコレクターの実行をスケジュール」を参照してください。
- ランタイムログを表示して、実行ステータスを監視し、問題のトラブルシューティングを行います。「コレクター実行のランタイムログの表示」を参照してください。
- データカタログで収集されたデータ資産を検出して評価します。「データカタログの管理」を参照してください。