データカタログ の探究
データカタログは、管理されたデータ資産を検索、評価、およびアクセスするためのセルフサービスディスカバリーレイヤーです。
データカタログは、ユーザーがデータ資産を検索し、そのリネージと品質を理解し、企業全体の管理データへのアクセスを要求する、一元化されたディスカバリーおよびガバナンスレイヤーを提供します。
データカタログの概要
データカタログは、一般的な企業の課題に対処します。データは数十のシステムに存在しますが、信頼できる十分に文書化された資産を見つけるには、チーム間で手動で調整する必要があります。データカタログは、統一されたディスカバリーレイヤーを提供することでこれを解決します。メタデータコレクターは技術メタデータを自動的に収集し、データスチュワードはビジネスコンテキストを追加し、コンシューマーはアクセスを要求する前に信頼スコアとリネージを評価します。
検索と検出:
キーワード検索、ファセットフィルタリング、ソースシステム、ドメイン、またはコレクションによる参照により、データ資産を検索します。検索では、資産名、説明、タグ、分類、ビジネス用語集を検索します。結果には、信頼スコアと品質インジケーターが含まれます。
資産の詳細と関係:
スキーマ、フィールドの説明、所有権、データ分類、リネージを含むデータの関係など、各データ資産の包括的な詳細を表示します。
ビジネス用語集:
エンタープライズデータの語彙を定義するビジネス用語集を作成および管理します。用語集をカタログ資産にリンクして、ビジネスコンテキストを提供します。これにより、組織全体でデータ定義の一貫した使用が促進されます。
メタデータコレクター:
ソースシステムに接続し、スキーマを検出し、リネージ関係をビルドする自動スキャナー。これらは、技術メタデータをデータカタログに入力します。コレクターは、ソースシステムの進化に合わせてカタログメタデータを最新の状態に保つために、スケジュールまたはオンデマンドで実行されます。
データカタログユーザー
| ユーザー | 説明 |
|---|---|
| 接続アドミン | 外部システムへの接続を作成および管理し、メタデータコレクターを構成します。コレクターの実行をスケジュールし、収集の実行とログを監視します。 |
| データスチュワード | カタログ資産をビジネスコンテキストで拡張し、ビジネス用語集を作成して維持します。用語を資産にリンクし、所有権を割り当て、タグと分類を管理し、資産をドメインとコレクションに整理し、資産ライフサイクルステータスを追跡します。 |
| カタログビューアー | データカタログを検索して参照し、データ資産を検出します。資産の詳細とリネージを表示し、信頼スコアと品質インジケーターを評価し、サンプルデータをプレビューし、分析、ワークフロー、または AI アプリケーションで使用する資産を特定します。 |
データカタログワークフロー
このライフサイクルは、データカタログ内のディスカバリー、ガバナンス、および消費の個別のフェーズを示します。
- 接続:接続アドミニストレーターは、外部データソースへの接続を作成し、メタデータコレクターを構成します。これらは、スキーマ、テーブル、列、関係、リネージなどの技術メタデータを収集します。
- 収集:メタデータコレクターは、スケジュールまたはオンデマンドで実行され、資産を検出してリネージ関係をビルドします。これらは、接続されたソースシステムからの最新の技術メタデータをカタログに入力します。
- 拡張:データスチュワードは、用語集の作成、用語の資産へのリンク、説明の追加、所有権の割り当て、分類の適用、資産のドメインとコレクションへの整理によって、ビジネスコンテキストを追加します
- 検出:カタログビューアーは、関連するデータ資産を検索して参照します。メタデータとリネージを確認し、信頼スコアを評価し、サンプルデータをプレビューして、要件を満たす資産を特定します。
- アクセス:ユーザーは、ガバナンスワークフローを通じて、検出された資産へのアクセスを要求します。承認後、データファブリックテーブル、API、アナリティクスダッシュボード、または AI エージェントを通じて、管理されたデータを使用します。
データカタログのメリット
| メリット | 機能 | ユーザー |
|---|---|---|
| 手動調整なしでエンタープライズシステム全体のデータ資産を検索 | 検索、参照、ファセットフィルタリング | 全ユーザー |
| アクセスを要求する前に、データの品質と信頼性を理解します | 信頼スコア、品質インジケーター、サンプルデータプレビュー | カタログビューアー |
| ソースシステムの進化に合わせてメタデータを自動的に検出してカタログ化します | メタデータコレクター、スケジュールされた収集 | 接続アドミン |
| エンタープライズデータのビジネスコンテキストと共有語彙を提供 | ビジネス用語集、資産の説明 | データスチュワード |
| 資産を整理および分類して、検出とガバナンスを向上させる | ドメイン、コレクション、タグ、分類 | データスチュワード |
| 所有権とスチュワードシップの割り当てを通じて説明責任を確立します | オーナーとスチュワードのアサイン、ライフサイクル管理 | データスチュワード |
次に探索する内容
データカタログの使用の詳細については、以下を参照してください。