Méthodes de connecteurs PDF
Accélérez le traitement PDF pour l’automatisation de vos documents à l’aide des différentes méthodes du connecteur PDF dans Studio de conception de bureau de RPA.
Charge
Charge un fichier PDF dans l’automatisation. Utilisez cette méthode pour charger le fichier PDF dans l’automatisation avant d’utiliser toute autre méthode PDF.
Utilisez le paramètre FilePath pour entrer le chemin d’accès du fichier PDF. Ce champ est obligatoire pour exécuter cette méthode.
ConvertToWord (en anglais seulement)
Convertit un PDF en Microsoft document Word. Vous devez utiliser le paramètre WordFilePath pour définir le chemin d’accès au fichier Word converti Microsoft .
ConvertToExcel
Convertit un document PDF en Microsoft document Excel. Vous devez utiliser le paramètre ExcelFilePath pour définir le chemin d’accès au fichier de sortie du fichier Excel converti Microsoft .
Convertir en HTML
Convertit un document PDF en document HTML.
| Paramètre | Description | Obligatoire ou non |
|---|---|---|
| Numéro de page | Numéro de page du document PDF converti en page HTML. | Oui |
| UseSameFontSize (Utiliser la même taille de police) | Vérifie si la même taille de police doit être utilisée pour la conversion au format HTML. La valeur par défaut est définie sur false. | Non |
ConvertToImage (Convertir en image)
Convertit un document PDF en document XML.
| Paramètre | Description | Obligatoire ou non |
|---|---|---|
| Chemin d'accès du dossier | Prend le chemin vers le dossier dans lequel le composant enregistre le PDF en tant qu’image à partir d’un composant précédemment exécuté. | Oui |
| Dpi | Prend la valeur des points par pouce (PPP) d’un composant précédemment exécuté. | Non |
| Qualité | Prend la valeur indiquant la qualité de l’image à partir d’un composant précédemment exécuté. | Non |
| Noms de fichiers | Renvoie le chemin d’accès et le nom de l’image enregistrée et les transmet au composant suivant. Lorsque le PDF source comprend plusieurs pages, le composant crée des images pour chaque page. |
Oui |
ConvertToImages (ConvertToImages)
Convertit les pages d’un document PDF en images.
| Paramètre | Description | Obligatoire ou non ? |
|---|---|---|
| Imagepath | Prend le chemin d’accès à l’emplacement dans le lecteur local où le composant enregistre les images d’un composant précédemment exécuté. | Oui |
| Numéro de page | Prend le numéro de page du fichier PDF à partir d’un composant précédemment exécuté. | Non |
| Dpi | Prend les points par pouce (PPP) d’un composant précédemment exécuté. Plus la valeur est élevée, meilleure est la qualité des images enregistrées. | Non |
| Qualité | Prend la valeur qui indique la qualité des images à partir d’un composant précédemment exécuté. Plus la valeur est élevée, meilleure est la qualité des images enregistrées. | Non |
ConvertToTables (ConvertToTables)
Convertissez le contenu d’un document PDF au format tabulaire. Utilisez le paramètre Return (Retour) pour récupérer les données du fichier PDF organisées en éléments tabulaires tels que l’en-tête et les colonnes.
ConvertToXml
Convertit un document PDF en document XML.
| Paramètre | Description | Obligatoire ou non ? |
|---|---|---|
| XmlFilePath | Prend le chemin de destination du fichier XML à partir d’un composant précédemment exécuté. | Oui |
| ConvertTablesOnly (en anglais seulement) | Utilise la valeur booléenne pour indiquer si le composant convertit uniquement les tables du document PDF. | Non |
| Numéro de page | Utilise le numéro de page du document PDF pour convertir la page en document XML à partir d’un composant précédemment exécuté. | Non |
Images d’extraction
Extrait une ou plusieurs pages d’un document PDF sous forme d’images et les enregistre.
| Paramètre | Description | Obligatoire ou non ? |
|---|---|---|
| Chemin d’accès du dossier | Prend le chemin de destination où les images extraites seront enregistrées à partir d’un composant précédemment exécuté. | Oui |
| Numéro de page | Utilise le numéro de page du document PDF pour extraire cette page uniquement à partir d’un composant précédemment exécuté. | Non. La connexion du port est facultative. |
| Noms | Renvoie le chemin d’accès et les noms des images extraites et les transmet aux composants suivants. | Oui |
GetAllTables (Obtenir toutes les tables)
Récupère toutes les données tabulaires d’un document PDF sous forme de liste. Utilisez le paramètre Return pour récupérer les données de table extraites sous forme de liste.
GetPageAsImage (Obtenir une page)
Extrait les données d’une page de document PDF et les stocke sous forme d’image en mémoire.
| Paramètre | Description | Obligatoire ou non ? |
|---|---|---|
| Numéro de page | Utilise le numéro de page du document PDF pour extraire cette page uniquement à partir d’un composant précédemment exécuté. | Non. La connexion du port est facultative. |
| Retour | Renvoie l’image en mémoire sous forme de bitmap et la transmet au composant suivant. | Oui |
GetPageCount (Obtenir un nombre de pages)
Récupère le nombre total de pages d’un document PDF. Vous devez utiliser le paramètre Return pour récupérer le nombre total de pages dans le PDF sous forme de nombre entier.
GetTable (en anglais)
Extrayez toutes les tables d’un document PDF et renvoyez les données tabulaires sous forme de table de données.
| Paramètre | Description | Obligatoire ou non ? |
|---|---|---|
| Extraire par | Prend le chemin d’accès au document PDF à partir d’un composant précédemment exécuté. | Oui |
| Valeur | Le format de la table. Par exemple, chaîne. | Non |
| Retour | Renvoie les tables d’une table de données. | Non |
Gettext
Extrait le texte d’un document PDF.
| Paramètre | Description | Obligatoire ou non ? |
|---|---|---|
| FromPage (page de départ) | Numéro de page pour commencer à récupérer le texte. Utilisez cette option si vous souhaitez récupérer du texte entre une plage de pages. La valeur par défaut est zéro. | Non |
| Vers la page | Numéro de page vers lequel vous récupérez le texte de la page de démarrage. Remarque : Assurez-vous que la valeur ToPage est supérieure à la valeur FromPage . |
Non |
| Retour | Renvoie le texte extrait sous forme de chaîne et le transmet au composant suivant. | Oui |
Charge
Charge un fichier PDF dans l’automatisation. Utilisez cette méthode pour charger le fichier PDF dans l’automatisation avant d’utiliser toute autre méthode PDF.
| Paramètre | Description | Obligatoire ou non ? |
|---|---|---|
| FilePath | Chemin d’accès au fichier PDF | Oui |
| Mot de passe | Mot de passe du document s’il est protégé par un mot de passe. | Non |
Fusionner
| Paramètre | Description | Obligatoire ou non ? |
|---|---|---|
| Filelist | Liste des fichiers PDF que vous souhaitez fusionner. Les fichiers doivent être répertoriés dans un format tableau. | Oui |
| Chemin d’accès au fichier de sortie | Chemin d’accès pour générer la sortie fusionnée des fichiers PDF. | Oui |
| Remplacer | Remplace un fichier dans le répertoire de sortie si le fichier porte le même nom que celui spécifié dans le paramètre OutputFilePath . La valeur par défaut est définie sur Non. | Non |
Division
Fractionne un seul fichier PDF en plusieurs fichiers PDF. Chaque page d’un fichier PDF est générée sous la forme d’un fichier PDF distinct. Utilisez le paramètre OutputFolderPath pour spécifier le chemin d’accès dans lequel vous souhaitez générer les fichiers.
Fermer
Ferme les références du fichier PDF que vous chargez dans l’automatisation à l’aide de la méthode Load.