Créer un collecteur de métadonnées Microsoft SQL Server
Créez un collecteur pour importer des métadonnées à partir de Microsoft SQL Server.
Avant de commencer
Avant de commencer, vérifiez les points suivants :
- Un serveur MID est configuré pour les modules de collection. Pour plus d'informations, consultez Serveur MID pour les collecteurs de métadonnées.
- Toutes les tâches requises sont terminées. Pour plus d'informations, consultez Préparer l’exécution du collecteur Microsoft SQL Server.
- Rôle requis : connection-admin
Procédure
- Accédez à la Tous > Structure de données de workflow > Accueil Workflow Data Fabric.
-
Sélectionnez l’icône du
dans la barre latérale gauche.
- Sélectionner Créer > Collecteur de métadonnées.
- Dans la liste Système, sélectionnez Microsoft SQL Server.
-
Complétez le formulaire.
Tableau 1. Nouveau formulaire du collecteur de métadonnées Microsoft SQL Server Champ Description Nom de la connexion Identificateur unique pour la connexion. Ce champ n’est pas modifiable une fois la connexion établie. Description brève Objet et détails de la connexion. -
Configurez les options d’authentification.
Tableau 2. Options d'authentification Champ Description Nom d'utilisateur Nom d’utilisateur à utiliser pour se connecter à la base de données. Mot de passe Mot de passe de l’utilisateur de la base de données. -
Sélectionnez dans Collecter tous les schémas ou Spécifier le schéma à collecter pour configurer les options de collecte de schémas.
Tableau 3. Options de collecte de schémas Champ Description Collecter tous les schémas Collecter tous les schémas Cataloguer tous les schémas auxquels l’utilisateur a accès. Exclure le schéma Nom ou expression régulière du schéma de base de données à exclure. Inclure le schéma d’informations Inclure le schéma d’informations de la base de données dans la collection de catalogue. Spécifier le schéma à collecter Spécifier le schéma à collecter Cataloguez uniquement les schémas spécifiés. Schéma Nom du schéma de base de données à cataloguer. -
Configurez les informations de connexion.
Tableau 4. Information de connexion Champ Description Serveur Nom d’hôte du serveur de base de données auquel se connecter. Port de serveur Port du serveur de base de données (s’il ne s’agit pas du port par défaut). Base de données Nom de la base de données à laquelle se connecter. Spécifiez plusieurs bases de données en ajoutant une valeur par ligne. Base de données exclue Nom ou expression régulière indiquant les bases de données à ne pas cataloguer lorsque le champ Base de données est vide. Remarque :Ce paramètre est ignoré si le champ Base de données est spécifié. -
Configurez les statistiques et les options d’échantillonnage.
Tableau 5. Statistiques et options d’échantillonnage Champ Description Activer la collecte des statistiques de colonne Activer la collecte des statistiques de colonne (c’est-à-dire le profilage des données). Remarque :L’activation du profilage peut augmenter l’exécution du collecteur, car celui-ci doit lire les données de table pour générer des métadonnées de profilage.Taille d’échantillon cible pour les statistiques de colonne Nombre de lignes échantillonnées pour le calcul des statistiques de colonne et des histogrammes chaîne-valeur. Par exemple, pour échantillonner 1000 lignes, définissez le paramètre sur : 1000. Par défaut : 100 000
Désactiver la collecte de traçabilité Ignorer la collecte des métadonnées de traçabilité intrabase de données. Désactiver la collecte de métadonnées étendue Ignorer la collecte des métadonnées étendues pour les types d’actifs de données tels que la base de données, le schéma, la table, les fonctions de colonnes, les procédures stockées, les types définis par l’utilisateur et les synonymes. Les métadonnées de base pour ces types d’actifs de données seront toujours collectées. -
Configurez les options de périmètre et de limites de collecte.
Tableau 6. Options relatives au champ d’application et aux limites de la collecte Champ Description Collecter les propriétés étendues Recueillez des informations sur les propriétés étendues à partir de SQL Server. Par exemple, les descriptions de colonnes. Désactiver la collection de réplication Ignorer la collecte des métadonnées de réplication. Activer la collection d’exemples de valeurs de chaîne Activez la collecte d’exemples de valeurs et d’histogrammes pour les colonnes contenant des données de chaîne. Exclure les fonctions système Excluez les fonctions système de la collecte de métadonnées. -
Configurez les options de connexion et de fiabilité.
Tableau 7. Options de connexion et de fiabilité Champ Description Environnement de serveur Nom convivial de l’environnement dans lequel votre serveur de base de données s’exécute lorsque le nom du serveur est localhost. Elle permet de la différencier des autres environnements. ID de la base de données Identificateur unique de cette base de données. Utilisé pour générer l’ID de la base de données lorsque le nom de la base de données n’est pas suffisamment unique. Désactiver la collecte de tâches de l’agent Ignorez la collecte des métadonnées des tâches de l’agent. Propriétés JDBC Propriétés du pilote JDBC à transmettre à la connexion du pilote. Délai d’expiration de l’analyse SQL Délai d’expiration en secondes pour l’analyse SQL pendant la collecte de traçabilité. Par défaut : 60
- Sélectionnez Enregistrer.
Résultats
Le collecteur de métadonnées est créé et apparaît sur la page Connecteurs avec un état Configuré. Il est maintenant prêt à se connecter au système source et à récolter des métadonnées.
Que faire ensuite
Après avoir créé le collecteur, vous pouvez effectuer l’une des tâches suivantes :
- Exécutez le collecteur manuellement pour collecter immédiatement les métadonnées. Consultez Exécuter manuellement les collecteurs de métadonnées.
- Automatisez la collecte de métadonnées en planifiant des exécutions régulières du collecteur. Consultez Planifier les exécutions du collecteur de métadonnées.
- Surveillez l’état d’exécution et résolvez les problèmes en consultant les journaux d’exécution. Consultez Afficher les journaux d’exécution pour les exécutions des collecteurs.
- Découvrez et évaluez les ressources de données collectées dans le catalogue de données. Consultez Régir le Catalogue de données.