PowerBI 메타데이터 수집기
PowerBI 메타데이터 수집기는 PowerBI 계정의 메타데이터에 대한 읽기 전용 액세스를 제공합니다.
Power BI 는 관련 없는 데이터 원본을 일관되고 시각적으로 몰입감이 있는 대화형 인사이트로 변환하기 위해 함께 작동하는 소프트웨어 서비스, 앱 및 커넥터의 컬렉션입니다. 데이터 소스에는 Excel 스프레드시트, 클라우드 기반 데이터 웨어하우스 또는 온-프레미스 하이브리드 데이터 웨어하우스가 포함될 수 있습니다. Power BI를 사용하면 데이터 원본에 연결하고, 중요한 정보를 시각화 및 검색하고, 조직 전체에서 인사이트를 공유할 수 있습니다.
Power BI 수집기는 Power BI 서비스 작업 영역에서 메타데이터를 수집합니다. 수집된 메타데이터를 사용하여 작업 영역에서 보고서와 대시보드를 검색하고 영향 분석을 수행하여 업스트림 데이터 원본의 변경 내용이 Power BI 보고서에 미치는 영향을 이해합니다.
지원되는 버전
수집기는 Power BI Cloud API v 1.0을 지원합니다.
인증 지원됨
- 서비스 원칙
- 사용자 및 암호
메타데이터 카탈로그됨
Power BI 수집기는 다음 정보를 카탈로그화합니다.
| 객체 | 수집된 정보 |
|---|---|
| 작업 공간 | 제목, 설명 |
| 앱 | 제목, 설명 |
| Power BI 측정값 | 제목, 설명, 숨겨짐 여부, 표현식 |
| 보고서 | 제목, 보고서 유형, 외부 URL, 포함된 URL, 이미지 미리 보기(페이지 매김된 보고서 유형에는 지원되지 않음), 생성한 날짜, 마지막으로 수정한 날짜, 작성자, 마지막으로 수정한 사람, 설명 |
| 보고서 페이지 | 제목 참고: Power BI API의 제한으로 인해 서비스 주체 인증을 사용할 때 앱 내의 보고서 페이지를 카탈로그할 수 없습니다. |
| 대시보드 | 제목, 외부 URL, 포함 URL |
| 대시보드 타일 | 제목, 포함 URL |
| 데이터 소스 | 제목, 데이터 소스 유형, 연결 상세 정보(종류 및 경로) |
| 시맨틱 모델 | 제목, 외부 URL, 설명, 생성한 날짜, 작성자, 일정 새로 고침 |
| 데이터 플로우 | 제목, 마지막으로 수정한 날짜, 설명, 작성자, 일정 새로 고침 |
| Power BI 테이블(시맨틱 모델 및 데이터 흐름) | 제목, 숨겨짐, 입력된 데이터, 설명, 소스 표현식 |
| Power BI 계산된 테이블 | 제목, 숨겨짐, 입력된 데이터, 설명, 소스 표현식 |
| Power BI 열 | 제목, 설명, 데이터 유형, 열 유형, 숨겨짐 여부, 표현식 |
| 표 형식 파일 | 파일 경로, 파일 이름 |
| 파일 디렉터리 | 디렉터리 경로 |
| 데이터베이스 | 직함, 유형, 식별자, 서버, 포트 |
| 데이터베이스 스키마 | 직위 |
| 데이터베이스 테이블 | 직위 |
| 데이터베이스 열 | 직위 |
| 테이블 | 제목, 설명 |
| 열 | 제목, 유형 |
| 계산 그룹 | 제목, 설명 |
| 계산 항목 | 제목, 설명, 표현식 |
객체 간 관계
카탈로그 페이지에는 다음 데이터 자산 유형 간의 관계가 표시됩니다.
| 데이터 자산 페이지 | 관계 |
|---|---|
| 앱 | 보고서, 대시보드, 작업 공간 |
| Power BI 열 | Power BI 테이블 |
| 데이터 소스 | 시맨틱 모델, 데이터 플로우, 테이블 형식 데이터 소스(데이터베이스, 테이블 형식 파일) |
| 타일 | 대시보드, 보고서, 시맨틱 모델 |
| 대시보드 | 타일, 작업 공간 |
| 대시보드 타일 | 연결된 시맨틱 모델 |
| 시맨틱 모델 | 대시보드 타일, 보고서 |
| 보고서 | 타일, 작업 공간, 보고서 페이지(페이지 매김된 보고서 유형에는 적용되지 않음), 시맨틱 모델(페이지 매김된 보고서 유형에는 적용되지 않음), 보고서 주: Power BI에서 앱 보고서 및 관련 작업 영역 보고서는 고유한 보고서 ID가 있는 두 개의 개별 보고서입니다. 수집기는 그 사이의 관계를 카탈로그화합니다. |
| 보고서 페이지 | 보고서(페이지 매김된 보고서 유형에는 적용되지 않음) |
| 시맨틱 모델 | 타일, 작업 공간, 보고서, 테이블, 데이터 소스, 시맨틱 모델, 데이터 플로우 |
| 작업 공간 | 보고서, 시맨틱 모델, 데이터 플로우, 대시보드, 앱 |
| 데이터 플로우 | 작업 공간, 테이블, 데이터 소스, 데이터 플로우 |
| Power BI 테이블 | 시맨틱 모델, 데이터 흐름, Power BI 열, Power BI 측정 |
| Power BI 측정 | Power BI 테이블 |
| 테이블 형식 데이터 소스(데이터베이스, 테이블 형식 파일) | 데이터 소스 |
| 계산 그룹 | Power BI 테이블 |
| 계산 항목 | 계산 그룹 |
PowerBI 계보
Power BI 수집기에서 수집하는 계보 정보는 다음과 같습니다. 수집기는 Power BI 스캐너 API 를 사용하여 소스 테이블 및 열에 대한 계보를 설정합니다. 스캐너 API의 제한 사항을 숙지해야 합니다.
| 객체 | 사용 가능한 계보 |
|---|---|
| 대시보드 타일 | 연결된 시맨틱 모델 |
| 시맨틱 모델 | 연결된 데이터 플로우, 시맨틱 모델 |
| 데이터 플로우 | 데이터 플로우 |
| Power BI 열 | 열이 데이터를 소싱하거나 값을 계산하는 연결된 열입니다. 주: 계보는 서버, 스키마, 테이블 또는 데이터베이스 이름 대신 매개 변수를 사용하는 Power BI 식에서 수집할 수 있습니다. 테이블 수준 및 열 수준 계보 및 카탈로그 관계는 Power BI API를 통해 테이블, 열, 보고서 간에 사용할 수 없습니다. |
| Power BI 테이블 | 테이블이 데이터를 소싱하는 관련된 테이블 참고: 주: 수집기는 API에서 반환된 Power BI 식을 사용하여 소스 열/테이블에 대한 계보를 구문 분석합니다. |
| Power BI 계산된 테이블 | 계산된 테이블이 값을 파생하는 Power BI 테이블 및 열입니다. |
| Power BI 측정 | 측정값이 데이터를 소싱하는 연결된 열 |
다음 표에는 지원되는 테이블 및 변환과 지원되지 않는 테이블 작업 및 변환이 나열되어 있습니다. 여기에는 계보 메타데이터 수집에 사용되는 소스 표현식, 계산된 열 및 측정값 표현식이 포함됩니다. 목록에 없는 작업은 수집되지 않습니다.
| 범주 | 범주 |
|---|---|
| 지원되는 매개변수화된 표현식 | 수집기는 전체 소스, 서버 또는 호스트, 웨어하우스, 데이터베이스 이름, 스키마 이름, 테이블 이름 및 SQL 표현식 값 대신 매개변수를 사용하는 소스 표현식을 구문 분석합니다. |
| 지원되는 데이터 함수 | Csv.Document, Excel.Workbook, File.Contents, Folder.Contents, Folder.Files, Json.Document, Odbc.DataSource, Odbc.InferOptions, Odbc.Query, Xml.Document, Web.Contents, Web.Headers, Web.BrowserContents, AmazonRedshift.Database, Sql.Database, Sql.Databases, Snowflake.Databases, PostgreSQL.Database, Databricks.Catalogs, Oracle.Database, Denodo.Contents, Databricks.Query, DatabricksMultiCloud.Catalogs, AnalysisServices.Database, GoogleBigQuery.Database |
| 지원되는 테이블 함수 | Table.AddColumn, Table.AddIndexColumn, Table.RenameColumns, Table.NestedJoin, Table.ExpandTableColumn, Table.SplitColumn, Table.DuplicateColumn, Table.CombineColumns |
| 지원되지 않는 테이블 작업 | Table.Pivot, Table.PromoteHeaders, Table.DemoteHeaders, Table.PrefixColumns, Table.TransformColumnNames, Table.Unpivot, Table.UnpivotOtherColumns, Table.AddFuzzyClusterColumn, Table.AddJoinColumn, Table.AggregateTableColumn, Table.Combine, Table.CombineColumnsToRecord, Table.ExpandRecordColumn, Table.Join, Table.Transpose |
| 지원되는 데이터 플로우 함수 | PowerPlatform.Dataflows, PowerBI.Dataflows |
| 지원되는 값 함수 | Value.NativeQuery |
| 지원되는 계산된 열 | 테이블 참조가 있거나 없는 열을 포함하는 계산된 열 표현식의 계보, 영숫자, 공백, 하이픈 및 밑줄이 있는 열 또는 테이블이 지원됩니다. |
| 지원되는 측정값 | 영숫자, 공백, 하이픈, 밑줄, 따옴표가 있는 열 또는 테이블을 포함하는 측정값 표현식의 계보가 지원됩니다. |
PowerBI 수집기 실행 준비
수집기를 실행하기 전에 Azure 애플리케이션 등록, 인증 및 권한을 설정합니다.
시작하기 전에
필요한 역할: 관리자
이 태스크 정보
수집기는 Azure 애플리케이션 등록을 사용하며 서비스 주체 또는 사용자 이름 및 암호의 두 가지 인증 방법을 지원합니다. 애플리케이션을 등록하고, 인증을 구성하고, 메타데이터 스캔을 사용하도록 설정하고, 테넌트 ID를 검색해야 합니다. 선택적으로 보고서 이미지 수집 및 계보 매핑을 구성합니다.
프로시저
Power BI 애플리케이션 등록
Azure에 애플리케이션을 등록하고 Power BI 수집기 인증을 위한 클라이언트 자격 증명을 만듭니다.
시작하기 전에
필요한 역할: 관리자
Azure Active Directory에 애플리케이션을 등록할 수 있는 권한이 있어야 합니다.
이 태스크 정보
Azure에서 애플리케이션을 등록하여 Power BI 수집기 인증에 필요한 클라이언트 ID 및 클라이언트 비밀을 가져옵니다.
프로시저
-
Azure에 새 애플리케이션을 등록합니다.
-
클라이언트 비밀을 만듭니다.
-
클라이언트 ID를 가져옵니다.
Power BI 서비스 주체 인증 구성
Power BI 메타데이터 수집을 사용하도록 서비스 주체 인증을 설정합니다.
시작하기 전에
필요한 역할: 관리자
서비스 주체 설정을 사용하도록 설정하려면 Power BI 관리자여야 합니다.
이 태스크 정보
서비스 주체 인증을 사용하는 경우 수집기는 개인 작업 공간, 사용자 작업 공간 및 보고서 페이지를 제외한 모든 객체를 수집합니다. 테넌트의 모든 앱과 작업 영역을 수집하려면 테넌트의 모든 작업 영역과 앱 카탈로그를 사용하도록 설정합니다. 개인 및 사용자 작업 공간을 포함하려면 사용자의 내 작업 공간에서 카탈로그 콘텐츠를 활성화합니다.
프로시저
Power BI 사용자 이름 및 암호 인증 구성
Power BI 메타데이터 수집을 사용하도록 사용자 이름 및 암호 인증에 대한 API 권한을 설정합니다.
시작하기 전에
필요한 역할: 관리자
Azure Active Directory에서 API 권한을 구성할 수 있는 권한이 있어야 합니다.
이 태스크 정보
사용자 인증을 사용하는 경우 수집기는 개인 작업 공간, 사용자 작업 공간 및 보고서 페이지를 제외한 모든 객체를 수집합니다. 테넌트의 모든 앱과 작업 영역을 수집하려면 테넌트의 모든 작업 영역 및 앱 카탈로그를 사용하도록 설정합니다. 개인 및 사용자 작업 공간을 포함하려면 사용자의 내 작업 공간에서 카탈로그 콘텐츠를 활성화합니다.
보고서 페이지를 수집하려면 사용자에게 각 작업 공간에 대한 액세스 권한을 부여합니다. 관리자 API에는 보고서 페이지에 대한 엔드포인트가 없습니다.
프로시저
Power BI 메타데이터 스캔 구성
메타데이터 스캔을 사용하여 테이블과 열을 포함한 자세한 데이터 소스 정보에 액세스합니다.
시작하기 전에
필요한 역할: 관리자
메타데이터 검사 설정을 사용하도록 설정하려면 Power BI 관리자여야 합니다.
이 태스크 정보
메타데이터 검사 는 Power BI 읽기 전용 관리 API를 통해 테이블 및 열과 같은 자세한 데이터 원본 정보에 대한 액세스를 제공합니다. 수집기는 Power BI 스캐너 API를 사용하여 소스 테이블 및 열에 대한 계보를 설정합니다. 수집기를 구성하기 전에 스캐너 API에 대한 제한 사항을 검토합니다.
프로시저
-
서비스 주체 인증의 경우:
- Power BI 설명서에 따라 Power BI 읽기 전용 API에 대한 서비스 주체 인증을 사용하도록 설정합니다.
- 메타데이터 검사를 위해 다음과 같은 향상된 테넌트 설정을 활성화합니다.
- 자세한 메타데이터로 관리자 API 응답 개선
- DAX 및 매시업 표현식을 사용하여 관리자 API 응답 개선
-
사용자 이름 및 암호 인증의 경우 메타데이터 검사를 위해 다음과 같은 향상된 테넌트 설정을 활성화합니다.
중요사항:메타데이터 검사를 사용하려면 사용자에게 관리자 권한(Microsoft 365 전역 관리자 또는 Power BI 서비스 관리자)이 있어야 합니다. 자세한 내용은 Power BI 설명서를 참조하세요.- 자세한 메타데이터로 관리자 API 응답 개선
- DAX 및 매시업 표현식을 사용하여 관리자 API 응답 개선
Power BI 테넌트 ID 가져오기
Power BI 애플리케이션에서 테넌트 ID를 검색합니다.
시작하기 전에
필요한 역할: 관리자
이 태스크 정보
테넌트 ID는 Power BI 수집기를 구성할 때 필요합니다. Power BI 애플리케이션에서 이 값을 검색합니다.
프로시저
Power BI 보고서 이미지 수집 구성
보고서 이미지 수집을 사용하도록 설정하여 Power BI 보고서에서 미리 보기 이미지를 수집합니다.
시작하기 전에
필요한 역할: 관리자
이 태스크 정보
보고서 이미지 수집을 사용하도록 설정하여 Power BI 보고서에서 미리 보기 이미지를 수집하여 데이터 카탈로그에 표시합니다.
프로시저
Power BI 계보 매핑 구성
YAML 파일을 생성하여 계보 수집을 위한 데이터 소스를 매핑합니다.
시작하기 전에
필요한 역할: 관리자
이 태스크 정보
이것은 계보 정보를 수집하기 위한 선택적 작업입니다. 수집기를 실행할 때 YAML 파일을 생성하고 데이터 소스 이름 매핑 파일 옵션을 사용하여 전달합니다.
다음 시나리오에서 YAML 파일을 설정합니다.
| 시나리오 | 상세 정보 | 작업 |
|---|---|---|
| Power BI의 ODBC 연결 | Power BI에는 ODBC 연결을 사용하는 데이터 원본이 있습니다. 이러한 경우 Power BI는 소스의 호스트 또는 데이터베이스 유형을 제공하지 않습니다 | YAML 파일에서 DSN을 특정 데이터베이스 호스트 및 유형에 매핑합니다. Power BI 데이터 원본에 데이터베이스 이름이 없는 경우 YAML 파일의 데이터 원본에 defaultDatabaseName 옵션을 추가합니다 |
| 여러 서버 이름 별칭 | 동일한 데이터베이스 인스턴스(호스트)에 대한 여러 서버 이름(별칭)이 있으며 데이터베이스 수집기가 Power BI 연결에 정의된 별칭과 다른 별칭을 사용합니다 | YAML 파일을 사용하여 데이터베이스 호스트를 사용자 지정 별칭에 매핑합니다. |
| 사용자 지정 SQL 문 | 사용자 지정 SQL 문은 Power BI 테이블 소스 정의에 사용됩니다. Power BI 수집기는 현재 SQL 문에서 계보를 해결하기 위해 Snowflake, SQL Server, PostgreSQL, Redshift, Oracle, Databricks, Denodo, BigQuery와 같은 데이터베이스 유형에 연결하는 것을 지원합니다. SQL 문을 사용한 테이블 소스의 계보 확인은 단일 SELECT 문으로 구성된 SQL만 지원합니다. | 환경 변수를 사용하여 datasourceKey, 호스트 및 보안 자격 증명을 포함하여 사용자 지정 SQL 문에 지정된 데이터베이스를 구성합니다 |
프로시저
PowerBI 메타데이터 수집기 만들기
PowerBI에서 메타데이터를 임포트하는 수집기를 생성합니다.
시작하기 전에
시작하기 전에 다음을 확인하십시오.
- 수집기용 MID 서버가 설정됩니다. 자세한 내용은 메타데이터 수집기용 MID 서버 문서를 참조하십시오.
- 모든 필수 작업이 완료되었습니다. 자세한 내용은 PowerBI 수집기 실행 준비 문서를 참조하십시오.
- 필요한 역할: connection-admin
프로시저
결과
메타데이터 수집기가 생성되고 커넥터 페이지에 구성됨 상태로 나타납니다. 이제 소스 시스템에 연결하고 메타데이터를 수집할 준비가 되었습니다.
다음에 수행할 작업
수집기를 생성한 후에는 다음 작업을 수행할 수 있습니다.
- 수집기를 수동으로 실행하여 메타데이터를 즉시 수집합니다. 메타데이터 수집기 수동 실행 문서를 참조하십시오.
- 정기적인 수집기 실행 일정을 예약하여 메타데이터 수집을 자동화합니다. 메타데이터 수집기 실행 예약 문서를 참조하십시오.
- 런타임 로그를 확인하여 실행 상태를 모니터링하고 문제를 해결합니다. 수집기 실행에 대한 런타임 로그 보기 문서를 참조하십시오.
- 데이터 카탈로그에서 수집된 데이터 자산을 검색하고 평가합니다. 관리 데이터 카탈로그 문서를 참조하십시오.