Collecteur de métadonnées PowerBI
Le collecteur de métadonnées PowerBI fournit un accès en lecture seule aux métadonnées à partir d’un compte PowerBI.
Power BI est un ensemble de services logiciels, d’applications et de connecteurs qui fonctionnent ensemble pour transformer des sources de données non liées en aperçus cohérents, visuellement immersifs et interactifs. Les sources de données peuvent inclure des feuilles de calcul Excel, des entrepôts de données basés sur le cloud ou des entrepôts de données hybrides sur site. Power BI vous permet de vous connecter à des sources de données, de visualiser et de découvrir des informations importantes, et de partager des informations au sein de l’organisation.
Le collecteur Power BI collecte les métadonnées des espaces de travail de service Power BI. Utilisez les métadonnées collectées pour découvrir des rapports et des tableaux de bord dans les espaces de travail et effectuez une analyse d’impact pour comprendre comment les changements apportés aux sources de données en amont affectent les rapports Power BI.
Version prise en charge
Le module de collection prend en charge Power BI Cloud API v 1.0.
Authentification prise en charge
- Principal du service
- Utilisateur et mot de passe
Métadonnées cataloguées
Le collecteur Power BI répertorie les informations suivantes :
| Objet | Informations collectées |
|---|---|
| Espaces de travail | Titre, description |
| Applications | Titre, description |
| Mesures Power BI | Titre, Description, Est masqué, Expression |
| Rapports | Titre, Type de rapports, URL externe, URL incorporée, Image d’aperçu (non pris en charge pour les types de rapports paginés), Date de création, Dernière modification, Créé par, Dernière modification par, Descriptions |
| Pages du rapport | Titre Remarque : les pages de rapport dans les applications ne peuvent pas être cataloguées lors de l’utilisation de l’authentification principale du service en raison de restrictions dans les API Power BI. |
| Tableaux de bord | Titre, URL externe, URL incorporée |
| Vignettes de tableaux de bord | Titre, URL incorporée |
| Sources de données | Titre, type de source de données, détails de connexion (type et chemin) |
| Modèle sémantique | Titre, URL externe, Description, Date de création, Créé par, Actualiser le calendrier |
| Flux de données | Titre, Dernière modification, Description, Créé par, Actualiser le calendrier |
| Tables Power BI (modèle sémantique et flux de données) | Titre, Est masqué, Sont des données saisies, Description, Expression source |
| Table calculée Power BI | Titre, Est masqué, Sont des données saisies, Description, Expression source |
| Colonnes Power BI | Titre, Descriptions, Type de données, Type de colonne, Est masqué, Expression |
| Fichier tabulaire | Chemin d’accès au fichier, Nom de fichier |
| Répertoire de fichiers | Chemin d’accès au répertoire |
| Base de données | Titre, Type, Identificateur, Serveur, Port |
| Schéma de base de données | Titre |
| Table de base de données | Titre |
| Colonne de base de données | Titre |
| Table | Titre, description |
| Colonne | Titre, type |
| Groupe de calcul | Titre, description |
| Élément de calcul | Titre, Description, Expression |
Relations entre les objets
Les pages de catalogue affichent les relations entre les types de ressources de données suivants :
| Page Actifs de données | Relation |
|---|---|
| Application | Rapport, tableau de bord, espace de travail |
| Colonne Power BI | Power BI Table |
| Source de données | Modèle sémantique, flux de données, source de données tabulaires (base de données, fichier tabulaire) |
| Mosaïque | Tableau de bord, Rapport, Modèle sémantique |
| Tableau de bord | Mosaïque, espace de travail |
| Vignette du tableau de bord | Modèle sémantique associé |
| Modèle sémantique | Vignette du tableau de bord, rapport |
| Rapport | Mosaïque, espace de travail, pages de rapport (ne s’applique pas aux types de rapports paginés), modèle sémantique (ne s’applique pas aux types de rapports paginés), rapport Remarque : Dans Power BI, les rapports d’application et leurs rapports d’espace de travail associés sont deux rapports distincts avec des ID de rapport uniques. Le collecteur répertorie la relation entre eux. |
| Pages du rapport | Rapport (ne s’applique pas aux types de rapports paginés) |
| Modèle sémantique | Mosaïque, Espace de travail, Rapport, Table, Source de données, Modèle sémantique, Flux de données |
| Espace de travail | Rapport, Modèle sémantique, Flux de données, Tableau de bord, Application |
| Flux de données | Espace de travail, Table, Source de données, Flux de données |
| Power BI Table | Modèle sémantique, flux de données, colonne Power BI, mesure Power BI |
| Mesure Power BI | Power BI Table |
| Source de données tabulaires (base de données, fichier tabulaire) | Source de données |
| Groupe de calcul | Power BI Table |
| Élément de calcul | Groupe de calcul |
Traçabilité pour PowerBI
Les informations de traçabilité suivantes sont collectées par le collecteur Power BI. Le collecteur utilise les API de l’analyseur Power BI pour établir la traçabilité avec les tables et colonnes sources. Assurez-vous de vous familiariser avec les limites des API de scanner
| Objet | Traçabilité disponible |
|---|---|
| Vignette du tableau de bord | Modèle sémantique associé |
| Modèle sémantique | Flux de données associé, modèle sémantique |
| Flux de données | Flux de données |
| Colonne Power BI | Colonnes associées à partir desquelles la colonne tire ses données ou calcule ses valeurs. Remarque : La traçabilité peut être récupérée à partir d’expressions Power BI qui utilisent des paramètres à la place des noms de serveur, de schéma, de table ou de base de données. Les relations de traçabilité et de catalogue au niveau de la table et de la colonne ne sont pas disponibles entre les tables ou les colonnes et les rapports via l’API Power BI. |
| Table Power BI | Tables associées à partir desquelles la table tire ses données Remarque : Remarque : Le collecteur utilise les expressions Power BI renvoyées par les API pour analyser la traçabilité aux colonnes/tables sources. |
| Table calculée Power BI | Tables et colonnes Power BI d’où la table calculée tire ses valeurs. |
| Mesure Power BI | Colonnes associées à partir desquelles la mesure s’approvisionne en données |
La table suivante répertorie les opérations et transformations de table prises en charge et non prises en charge. Cela inclut les expressions sources, les colonnes calculées et les expressions de mesure utilisées dans la collecte des métadonnées de traçabilité. Les opérations non répertoriées ne sont pas récoltées.
| Catégorie | Catégorie |
|---|---|
| Expressions paramétrées prises en charge | Le collecteur analyse les expressions source qui utilisent des paramètres à la place des valeurs suivantes : source complète, serveur ou hôte, entrepôt, nom de base de données, nom de schéma, nom de table et expressions SQL. |
| Fonctions de données prises en charge | Csv.Document, Excel.Workbook, File.Contents, Folder.Contents, Folder.Files, Json.Document, Odbc.DataSource, Odbc.InferOptions, Odbc.Query, Xml.Document, Web.Contents, Web.Headers, Web.BrowserContents, AmazonRedshift.Database, Sql.Database, Sql.Databases, Snowflake.Databases, PostgreSQL.Database, Databricks.Catalogs, Oracle.Database, Denodo.Contents, Databricks.Query, DatabricksMultiCloud.Catalogs, AnalysisServices.Database, GoogleBigQuery.Database |
| Fonctions de table prises en charge | Table.AjouterColonne, Table.AjouterIndexColonne, Table.RenommerColonnes, Table.JointureImmature, Table.ExpandTableColonne, Table.DiviserColonne, Table.Colonne Dupliquée, Table.CombineColumns |
| Opérations de table non prises en charge | Table.Pivot, Table.PromoteHeaders, Table.DemoteHeaders, Table.PrefixColumns, Table.TransformColumnNames, Table.Unpivot, Table.UnpivotOtherColumns, Table.AddFuzzyClusterColumn, Table.AddJoinColumn, Table.AggregateTableColumn, Table.Combine, Table.CombineColumnsToRecord, Table.ExpandRecordColumn, Table.Join, Table.Transpose |
| Fonctions de flux de données prises en charge | PowerPlatform.Flux de données, PowerBI.Flux de données |
| Fonctions de valeur prises en charge | Valeur.RequêteNative |
| Colonnes calculées prises en charge | Traçabilité à partir des expressions de colonnes calculées contenant des colonnes avec et sans références de table, des colonnes ou des tables avec des caractères alphanumériques, des espaces, des tirets et des traits de soulignement sont pris en charge |
| Mesures prises en charge | Traçabilité à partir des expressions de mesure contenant des colonnes ou des tables avec des caractères alphanumériques, des espaces, des traits d’union, des traits de soulignement et des guillemets environnants sont pris en charge |
Préparer l’exécution du collecteur PowerBI
Configurez l’inscription, l’authentification et les autorisations de l’application Azure avant d’exécuter le module de collection.
Avant de commencer
Rôle requis : admin
Pourquoi et quand exécuter cette tâche
Le collecteur utilise l’inscription de l’application Azure et prend en charge deux méthodes d’authentification : principal du service ou nom d’utilisateur et mot de passe. Vous devez enregistrer une application, configurer l’authentification, activer l’analyse des métadonnées et récupérer l’ID de locataire. Vous pouvez également configurer la collecte d’images de rapport et le mappage de traçabilité.
Procédure
Inscrire l’application Power BI
Enregistrez une application dans Azure et créez les informations d’identification du client pour l’authentification du collecteur Power BI.
Avant de commencer
Rôle requis : admin
Vous devez disposer des autorisations nécessaires pour enregistrer des applications dans Azure Active Directory.
Pourquoi et quand exécuter cette tâche
Enregistrez une application dans Azure pour obtenir l’ID client et le secret client nécessaires à l’authentification Power BI Collector.
Procédure
-
Enregistrez une nouvelle application dans Azure.
-
Créez un secret client.
-
Obtenez l’ID client.
Configurer l’authentification principale du service Power BI
Configurez l’authentification principale du service pour activer la collecte de métadonnées Power BI.
Avant de commencer
Rôle requis : admin
Vous devez être administrateur Power BI pour activer les paramètres principal du service.
Pourquoi et quand exécuter cette tâche
Lors de l’authentification principale du service, le collecteur collecte tous les objets, à l’exception des espaces de travail personnels, des espaces de travail utilisateur et des pages de rapport. Pour collecter toutes les applications et tous les espaces de travail du locataire, activez Cataloguer tous les espaces de travail et applications du locataire. Pour inclure des espaces de travail personnels et utilisateur, activez le contenu du catalogue de Mon espace de travail de l’utilisateur.
Procédure
Configurer l’authentification par nom d’utilisateur et mot de passe Power BI
Configurez des autorisations d’API pour l’authentification par nom d’utilisateur et mot de passe afin d’activer la collecte de métadonnées Power BI.
Avant de commencer
Rôle requis : admin
Vous devez disposer des autorisations pour configurer les autorisations d’API dans Azure Active Directory.
Pourquoi et quand exécuter cette tâche
Lors de l’authentification utilisateur, le collecteur collecte tous les objets, à l’exception des espaces de travail personnels, des espaces de travail utilisateur et des pages de rapport. Pour collecter toutes les applications et tous les espaces de travail du locataire, activez Cataloguer tous les espaces de travail et applications du locataire. Pour inclure des espaces de travail personnels et utilisateur, activez le contenu du catalogue de Mon espace de travail de l’utilisateur.
Pour recueillir des pages de rapport, accordez à l’utilisateur l’accès à chaque espace de travail. L’API d’administration n’a pas de point de terminaison pour les pages de rapport.
Procédure
Configurer l’analyse des métadonnées Power BI
Activez l’analyse des métadonnées pour accéder à des informations détaillées sur la source de données, y compris les tables et les colonnes.
Avant de commencer
Rôle requis : admin
Vous devez être administrateur Power BI pour activer les paramètres d’analyse des métadonnées.
Pourquoi et quand exécuter cette tâche
L’analyse des métadonnées permet d’accéder à des informations détaillées sur les sources de données, telles que les tables et les colonnes, via les API d’administration en lecture seule Power BI. Le collecteur utilise les API de l’analyseur Power BI pour établir la traçabilité avec les tables et colonnes sources. Examinez les limitations des API du scanner avant de configurer le collecteur.
Procédure
-
Pour l’authentification principale du service :
- Suivez la documentation Power BI pour activer l’authentification principale du service pour les API en lecture seule Power BI
- Activez les paramètres de locataire améliorés suivants pour l’analyse des métadonnées :
- Améliorez les réponses des API d’administration avec des métadonnées détaillées
- Améliorez les réponses des API d’administration avec des expressions DAX et d’application composite
-
Pour l’authentification par nom d’utilisateur et mot de passe, activez les paramètres de locataire améliorés suivants pour l’analyse des métadonnées :
Important :L’utilisateur doit disposer des droits d’administrateur (administrateur global Microsoft 365 ou administrateur de service Power BI) pour utiliser l’analyse des métadonnées. Pour plus d’informations, consultez la documentation Power BI.- Améliorez les réponses des API d’administration avec des métadonnées détaillées
- Améliorez les réponses des API d’administration avec des expressions DAX et d’application composite
Obtenir l’ID de locataire Power BI
Récupérez l’ID de locataire à partir de l’application Power BI.
Avant de commencer
Rôle requis : admin
Pourquoi et quand exécuter cette tâche
L’ID de locataire est requis lors de la configuration du collecteur Power BI. Récupérez cette valeur à partir de l’application Power BI.
Procédure
Configurer la collecte d’images de rapport Power BI
Activez la collecte d’images de rapports pour collecter des images d’aperçu à partir des rapports Power BI.
Avant de commencer
Rôle requis : admin
Pourquoi et quand exécuter cette tâche
Activez la collecte d’images de rapports pour collecter des images d’aperçu à partir des rapports Power BI en vue de les afficher dans le catalogue de données.
Procédure
Configurer le mappage de traçabilité Power BI
Créez un fichier YAML pour mapper des sources de données pour la collecte de lignées.
Avant de commencer
Rôle requis : admin
Pourquoi et quand exécuter cette tâche
Il s’agit d’une tâche facultative pour la collecte des informations de traçabilité. Créez un fichier YAML et transmettez-le à l’aide de l’option de fichier de mappage de nom de la source de données lors de l’exécution du collecteur.
Configurez un fichier YAML dans les scénarios suivants :
| Scénario | Détails | Action |
|---|---|---|
| Connexions ODBC dans Power BI | Vous disposez d’une source de données dans Power BI qui utilise une connexion ODBC. Dans ces cas, Power BI ne fournit pas le type d’hôte ou de base de données de la source | Dans le fichier YAML, mappez le DSN à un hôte et à un type de base de données spécifiques. Si le nom de la base de données est manquant dans la source de données Power BI, ajoutez l’option defaultDatabaseName à la source de données dans le fichier YAML |
| Alias de noms de serveurs multiples | Vous avez plusieurs noms de serveur (alias) pour la même instance de base de données (hôte) et le collecteur de base de données utilise un alias différent de celui défini dans la connexion Power BI | Utilisez le fichier YAML pour mapper l’hôte de base de données aux alias spécifiés par l’utilisateur |
| Instructions SQL personnalisées | Les instructions SQL personnalisées sont utilisées dans les définitions de sources de tables Power BI. Le collecteur Power BI prend actuellement en charge la connexion aux types de bases de données suivants pour résoudre la traçabilité à partir d’instructions SQL : Snowflake, SQL Server, PostgreSQL, Redshift, Oracle, Databricks, Denodo, BigQuery. La résolution de traçabilité pour les sources de table utilisant des instructions SQL prend uniquement en charge le SQL consistant en une seule instruction SELECT | Configurez les bases de données spécifiées dans des instructions SQL personnalisées en incluant datasourceKey, hôte et informations d’identification sécurisées à l’aide de variables environnementales |
Procédure
Créer un collecteur de métadonnées PowerBI
Créez un collecteur pour importer des métadonnées à partir de PowerBI.
Avant de commencer
Avant de commencer, vérifiez les points suivants :
- Un serveur MID est configuré pour les modules de collection. Pour plus d'informations, consultez Serveur MID pour les collecteurs de métadonnées.
- Toutes les tâches requises sont terminées. Pour plus d'informations, consultez Préparer l’exécution du collecteur PowerBI.
- Rôle requis : connection-admin
Procédure
Résultats
Le collecteur de métadonnées est créé et apparaît sur la page Connecteurs avec un état Configuré. Il est maintenant prêt à se connecter au système source et à récolter des métadonnées.
Que faire ensuite
Après avoir créé le collecteur, vous pouvez effectuer l’une des tâches suivantes :
- Exécutez le collecteur manuellement pour collecter immédiatement les métadonnées. Consultez Exécuter manuellement les collecteurs de métadonnées.
- Automatisez la collecte de métadonnées en planifiant des exécutions régulières du collecteur. Consultez Planifier les exécutions du collecteur de métadonnées.
- Surveillez l’état d’exécution et résolvez les problèmes en consultant les journaux d’exécution. Consultez Afficher les journaux d’exécution pour les exécutions des collecteurs.
- Découvrez et évaluez les ressources de données collectées dans le catalogue de données. Consultez Régir le Catalogue de données.