Méthodes de connecteurs PDF

  • Rversion finale: Washingtondc
  • Mis à jour 1 févr. 2024
  • 5 minutes de lecture
  • Accélérez le traitement PDF pour l’automatisation de vos documents à l’aide des différentes méthodes du connecteur PDF dans Studio de conception de bureau de RPA.

    Charge

    Charge un fichier PDF dans l’automatisation. Utilisez cette méthode pour charger le fichier PDF dans l’automatisation avant d’utiliser toute autre méthode PDF.

    Utilisez le paramètre FilePath pour entrer le chemin d’accès du fichier PDF. Ce champ est obligatoire pour exécuter cette méthode.

    ConvertToWord (en anglais seulement)

    Convertit un PDF en Microsoft document Word. Vous devez utiliser le paramètre WordFilePath pour définir le chemin d’accès au fichier Word converti Microsoft .

    ConvertToExcel

    Convertit un document PDF en Microsoft document Excel. Vous devez utiliser le paramètre ExcelFilePath pour définir le chemin d’accès au fichier de sortie du fichier Excel converti Microsoft .

    Convertir en HTML

    Convertit un document PDF en document HTML.

    Tableau 1. Paramètres de la méthode ConvertToHTML
    Paramètre Description Obligatoire ou non
    Numéro de page Numéro de page du document PDF converti en page HTML. Oui
    UseSameFontSize (Utiliser la même taille de police) Vérifie si la même taille de police doit être utilisée pour la conversion au format HTML. La valeur par défaut est définie sur false. Non

    ConvertToImage (Convertir en image)

    Convertit un document PDF en document XML.

    Tableau 2. Paramètres de la méthode ConvertToImage
    Paramètre Description Obligatoire ou non
    Chemin d'accès du dossier Prend le chemin vers le dossier dans lequel le composant enregistre le PDF en tant qu’image à partir d’un composant précédemment exécuté. Oui
    Dpi Prend la valeur des points par pouce (PPP) d’un composant précédemment exécuté. Non
    Qualité Prend la valeur indiquant la qualité de l’image à partir d’un composant précédemment exécuté. Non
    Noms de fichiers Renvoie le chemin d’accès et le nom de l’image enregistrée et les transmet au composant suivant.

    Lorsque le PDF source comprend plusieurs pages, le composant crée des images pour chaque page.

    Oui

    ConvertToImages (ConvertToImages)

    Convertit les pages d’un document PDF en images.

    Tableau 3. Paramètres de la méthode ConvertToImages
    Paramètre Description Obligatoire ou non ?
    Imagepath Prend le chemin d’accès à l’emplacement dans le lecteur local où le composant enregistre les images d’un composant précédemment exécuté. Oui
    Numéro de page Prend le numéro de page du fichier PDF à partir d’un composant précédemment exécuté. Non
    Dpi Prend les points par pouce (PPP) d’un composant précédemment exécuté. Plus la valeur est élevée, meilleure est la qualité des images enregistrées. Non
    Qualité Prend la valeur qui indique la qualité des images à partir d’un composant précédemment exécuté. Plus la valeur est élevée, meilleure est la qualité des images enregistrées. Non

    ConvertToTables (ConvertToTables)

    Convertissez le contenu d’un document PDF au format tabulaire. Utilisez le paramètre Return (Retour) pour récupérer les données du fichier PDF organisées en éléments tabulaires tels que l’en-tête et les colonnes.

    ConvertToXml

    Convertit un document PDF en document XML.

    Tableau 4. Paramètres de la méthode ConvertToXml
    Paramètre Description Obligatoire ou non ?
    XmlFilePath Prend le chemin de destination du fichier XML à partir d’un composant précédemment exécuté. Oui
    ConvertTablesOnly (en anglais seulement) Utilise la valeur booléenne pour indiquer si le composant convertit uniquement les tables du document PDF. Non
    Numéro de page Utilise le numéro de page du document PDF pour convertir la page en document XML à partir d’un composant précédemment exécuté. Non

    Images d’extraction

    Extrait une ou plusieurs pages d’un document PDF sous forme d’images et les enregistre.

    Tableau 5. Paramètres de la méthode ExtractImages
    Paramètre Description Obligatoire ou non ?
    Chemin d’accès du dossier Prend le chemin de destination où les images extraites seront enregistrées à partir d’un composant précédemment exécuté. Oui
    Numéro de page Utilise le numéro de page du document PDF pour extraire cette page uniquement à partir d’un composant précédemment exécuté. Non. La connexion du port est facultative.
    Noms Renvoie le chemin d’accès et les noms des images extraites et les transmet aux composants suivants. Oui

    GetAllTables (Obtenir toutes les tables)

    Récupère toutes les données tabulaires d’un document PDF sous forme de liste. Utilisez le paramètre Return pour récupérer les données de table extraites sous forme de liste.

    GetPageAsImage (Obtenir une page)

    Extrait les données d’une page de document PDF et les stocke sous forme d’image en mémoire.

    Tableau 6. Paramètres de la méthode GetPageAsImage
    Paramètre Description Obligatoire ou non ?
    Numéro de page Utilise le numéro de page du document PDF pour extraire cette page uniquement à partir d’un composant précédemment exécuté. Non. La connexion du port est facultative.
    Retour Renvoie l’image en mémoire sous forme de bitmap et la transmet au composant suivant. Oui

    GetPageCount (Obtenir un nombre de pages)

    Récupère le nombre total de pages d’un document PDF. Vous devez utiliser le paramètre Return pour récupérer le nombre total de pages dans le PDF sous forme de nombre entier.

    GetTable (en anglais)

    Extrayez toutes les tables d’un document PDF et renvoyez les données tabulaires sous forme de table de données.

    Tableau 7. Paramètres de la méthode GetTable
    Paramètre Description Obligatoire ou non ?
    Extraire par Prend le chemin d’accès au document PDF à partir d’un composant précédemment exécuté. Oui
    Valeur Le format de la table. Par exemple, chaîne. Non
    Retour Renvoie les tables d’une table de données. Non

    Gettext

    Extrait le texte d’un document PDF.

    Tableau 8. Paramètres de la méthode GetText
    Paramètre Description Obligatoire ou non ?
    FromPage (page de départ) Numéro de page pour commencer à récupérer le texte. Utilisez cette option si vous souhaitez récupérer du texte entre une plage de pages. La valeur par défaut est zéro. Non
    Vers la page Numéro de page vers lequel vous récupérez le texte de la page de démarrage.
    Remarque :
    Assurez-vous que la valeur ToPage est supérieure à la valeur FromPage .
    Non
    Retour Renvoie le texte extrait sous forme de chaîne et le transmet au composant suivant. Oui

    Charge

    Charge un fichier PDF dans l’automatisation. Utilisez cette méthode pour charger le fichier PDF dans l’automatisation avant d’utiliser toute autre méthode PDF.

    Tableau 9. Paramètres de la méthode de charge
    Paramètre Description Obligatoire ou non ?
    FilePath Chemin d’accès au fichier PDF Oui
    Mot de passe Mot de passe du document s’il est protégé par un mot de passe. Non

    Fusionner

    Combine plusieurs fichiers PDF.
    Tableau 10. Paramètres de la méthode de fusion
    Paramètre Description Obligatoire ou non ?
    Filelist Liste des fichiers PDF que vous souhaitez fusionner. Les fichiers doivent être répertoriés dans un format tableau. Oui
    Chemin d’accès au fichier de sortie Chemin d’accès pour générer la sortie fusionnée des fichiers PDF. Oui
    Remplacer Remplace un fichier dans le répertoire de sortie si le fichier porte le même nom que celui spécifié dans le paramètre OutputFilePath . La valeur par défaut est définie sur Non. Non
    Remarque :
    Si les fichiers PDF sont protégés par un mot de passe ou dans un format incorrect dans le paramètre FileList , l’automatisation affiche une erreur.

    Division

    Fractionne un seul fichier PDF en plusieurs fichiers PDF. Chaque page d’un fichier PDF est générée sous la forme d’un fichier PDF distinct. Utilisez le paramètre OutputFolderPath pour spécifier le chemin d’accès dans lequel vous souhaitez générer les fichiers.

    Fermer

    Ferme les références du fichier PDF que vous chargez dans l’automatisation à l’aide de la méthode Load.