PostgreSQL メタデータコレクターの作成
PostgreSQL からメタデータをインポートするコレクターを作成します。
始める前に
開始する前に、以下を確認してください。
- コレクター用の MID サーバーがセットアップされます。詳細については、「メタデータコレクター用の MID サーバー」を参照してください。
- 要件ごとのタスクがすべて完了しました。詳細については、「PostgreSQL コレクタを実行する準備をします」を参照してください。
- 必要なロール:connection-admin
手順
- 移動先 すべて > ワークフローデータファブリック > Workflow Data Fabric ホーム.
-
左側のサイドバーで [コネクトハブ]
を選択します。
- 選択 作成 > メタデータコレクター.
- [システム] リストから [PostgeSQL] を選択します。
-
フォームに入力します。
表 : 1. 新しい PostgeSQL メタデータコレクターフォーム フィールド 説明 接続名 接続の一意の識別子。接続が確立されると、このフィールドは変更できません。 簡単な説明 接続の目的と詳細。 -
認証オプションを設定します。
表 : 2. 認証オプション フィールド 説明 ユーザー名とパスワードを使用して認証 ユーザー名とパスワードを使用してデータベースに接続する認証オプション。 AWS IAM を使用した認証 (明示的な認証情報) AWS アクセスキー ID と AWS 秘密アクセスキーを使用して認証するオプション。 -
[すべてのスキーマを収集] および [収集するスキーマを指定] から選択します。
表 : 3. スキーマ収集オプション フィールド 説明 すべてのスキーマを収集 すべてのスキーマを収集 ユーザーがアクセスできるすべてのスキーマをカタログ化します。 スキーマを除外 除外するデータベーススキーマの名前または正規表現。 情報スキーマを含める データベースの情報スキーマをカタログコレクションに含めます。 収集するスキーマを指定 収集するスキーマを指定 指定されたスキーマのみをカタログ化します。 スキーマ カタログするデータベーススキーマの名前。 -
接続情報を構成します。
表 : 4. 接続情報 フィールド 説明 サーバー 接続するデータベースサーバーのホスト名。 サーバーポート データベースサーバーのポート (デフォルトでない場合)。 データベース 接続するデータベースの名前。1 行に 1 つの値を追加して、複数のデータベースを指定します。 除外データベース [データベース] フィールドが空の場合にデータベースをカタログ化しないことを示す名前または正規表現。 注:[データベース] フィールドが指定されている場合、このパラメーターは無視されます。 -
統計情報とサンプリングオプションを設定します。
表 : 5. 統計情報とサンプリングオプション フィールド 説明 列統計情報の収集を有効にする 列統計情報の収集 (つまり、データプロファイリング) を有効にします。 注:プロファイリングを有効にすると、コレクターはプロファイリングメタデータを生成するためにテーブルデータを読み取る必要があるため、コレクターの実行時間が長くなる可能性があります。列統計のターゲットサンプルサイズ 列の統計情報と文字列値ヒストグラムの計算のためにサンプリングされた行数。たとえば、1000 行をサンプリングするには、パラメーターを 1000 に設定します。 デフォルト:100000
リネージ収集を無効にする データベース内リネージメタデータの収集をスキップします。 SQL 解析タイムアウト リネージ収集中の SQL 解析のタイムアウト (秒)。 デフォルト:60
拡張メタデータ収集を無効にする データベース、スキーマ、テーブル、列関数、ストアドプロシージャ、ユーザー定義型、同義語などのデータ資産タイプの拡張メタデータの収集をスキップします。これらのデータ資産タイプの基本メタデータは引き続き収集されます。 -
収集スコープと制限オプションを構成します。
表 : 6. 収集スコープと制限オプション フィールド 説明 サンプル文字列値の収集を有効にする 文字列データを含む列のサンプル値とヒストグラムの収集を有効にします。 システム機能を除外 メタデータ収集からシステム関数を除外します。 -
接続と信頼性のオプションを構成します。
表 : 7. 接続と信頼性のオプション フィールド 説明 サーバー環境 サーバー名が localhost の場合に、データベースサーバーが実行される環境の分かりやすい名前です。他の環境との差別化に役立ちます。 データベース ID このデータベースの一意の識別子。データベース名が十分に一意でない場合にデータベース ID を生成するために使用されます。 JDBC プロパティ ドライバー接続に渡す JDBC ドライバープロパティ。 SQL 解析タイムアウト リネージ収集中の SQL 解析の AddSQL 解析 timeoutSaveTimeout (秒)。 デフォルト:60
- [Save (保存)] を選択します。
タスクの結果
メタデータコレクターが作成され、[コネクタ] ページに [構成済み] ステータスで表示されます。これで、ソースシステムに接続してメタデータを収集する準備ができました。
次のタスク
コレクターを作成した後、次のいずれかのタスクを実行できます。
- コレクターを手動で実行して、メタデータをすぐに収集します。「メタデータコレクターを手動で実行する」を参照してください。
- 定期的なコレクターの実行をスケジュールすることで、メタデータ収集を自動化します。「メタデータコレクターの実行をスケジュール」を参照してください。
- ランタイムログを表示して、実行ステータスを監視し、問題のトラブルシューティングを行います。「コレクター実行のランタイムログの表示」を参照してください。
- データカタログで収集されたデータ資産を検出して評価します。「データカタログの管理」を参照してください。