PDF-Connector-Methoden
Beschleunigen Sie die PDF-Verarbeitung für Ihre Dokumentautomatisierung mit den verschiedenen Methoden des PDF-Connectors in RPA Desktop Design Studio.
Schließen
Schließt die dem PDF-Dokument zugeordneten Ressourcen. Verwenden Sie diese Methode, um Referenzen und Ressourcen freizugeben, nachdem Sie die Lademethode verwendet haben.
Rufen Sie diese Methode auf, wenn Sie das PDF-Dokument nicht mehr verwenden müssen oder nachdem Sie Vorgänge damit abgeschlossen haben.
KonvertierenInExcel
Konvertiert ein PDF-Dokument in ein MicrosoftMicrosoft Azure Event Hubs Excel-Dokument. Optional können nur Tabellen konvertiert werden, wenn angegeben.
Rufen Sie diese Methode mit dem Dateipfad auf, in dem das konvertierte Excel-Dokument gespeichert werden muss, und legen Sie „ConvertTablesOnly“ optional auf „wahr“ fest, wenn nur Tabellen konvertiert werden müssen.
| Parameter | Beschreibung | Datentyp |
|---|---|---|
| Excel-Dateipfad | Der Dateipfad, in dem das konvertierte Excel-Dokument (.xlsx) gespeichert wird. Stellen Sie sicher, dass der Dateipfad den Dateinamen und die Erweiterung enthält. | Zeichenfolge |
| Nur konvertierenTabellen | Bei Festlegung auf truewerden nur Tabellen aus dem PDF-Dokument in Excel konvertiert. Der Standardwert ist true. | Boolean |
KonvertierenInHTML
Konvertiert eine angegebene Seite eines PDF-Formats in ein HTML-Format. Wenn die Seitenzahl kleiner oder gleich 0 ist, werden alle Seiten der PDF-Datei in HTML konvertiert.
Rufen Sie diese Methode mit der Seitenzahl der PDF-Datei auf, die Sie in HTML konvertieren möchten. Wenn Sie eine Seitenzahl kleiner oder gleich 0 übergeben, wird die gesamte PDF-Datei in HTML konvertiert. Die Methode gibt den HTML-Inhalt als Zeichenfolge zurück.
| Parameter | Beschreibung | Datentyp |
|---|---|---|
| PageNumber (Dateneingang) | Die Seitenzahl der PDF-Datei, die in HTML konvertiert werden soll. Wenn dieser Parameter kleiner oder gleich 0 ist, werden alle Seiten der PDF-Datei in HTML konvertiert. Seitenzahlen beginnen normalerweise mit 1. | Int32 |
| Rückgabe (Datenausgabe) | Diese Methode gibt den HTML-Inhalt als Zeichenfolge zurück, die den Inhalt der PDF-Datei darstellt. | Zeichenfolge |
Bild konvertieren
Konvertiert eine angegebene Seite eines PDF-Dokuments in ein Bild. Geben Sie optional den Bildpfad, in dem das Bild gespeichert wird, DPI (Punkte pro Zoll) und die Bildqualität an.
Rufen Sie diese Methode mit der Seitenzahl der zu konvertierenden PDF-Datei, dem Dateipfad, unter dem das Bild gespeichert werden muss, und optional die Parameter für DPI und Bildqualität an.
| Parameter | Beschreibung | Datentyp |
|---|---|---|
| PageNumber | Die Seitenzahl der PDF-Datei, die in ein Bild konvertiert werden soll. Seitenzahlen beginnen normalerweise mit 1. | Int32 |
| ImagePath | Der Dateipfad, in dem das konvertierte Bild gespeichert wird. Stellen Sie sicher, dass der Dateipfad den Dateinamen und die Erweiterung enthält | Zeichenfolge |
| dpi | Die DPI-Auflösung (Punkte pro Zoll) für das generierte Bild. Der Standardwert ist 200 dpi. | Int32 |
| Qualität | Die Qualitätsstufe des generierten Bildes im Bereich von 0 (am niedrigsten) bis 100 (am höchsten). Der Standardwert ist 95. | Int32 |
ImagesToImages konvertieren
Konvertiert ein PDF-Dokument in Bilder. Geben Sie optional den Ordnerpfad zum Speichern der Bilder, DPI (Punkte pro Zoll), Bildqualität und eine optionale Liste zum Speichern der generierten Dateinamen an.
Rufen Sie diese Methode mit dem Ordnerpfad auf, in dem die Bilder gespeichert werden müssen. Passen Sie optional die Parameter für DPI und Bildqualität an. Wenn Sie eine Liste als Parameter FileNames angeben, wird sie mit den Namen der generierten Bilddateien ausgefüllt.
| Parameter | Beschreibung | Datentyp |
|---|---|---|
| Ordnerpfad | Der Ordnerpfad, in dem die konvertierten Bilder gespeichert werden. Stellen Sie sicher, dass der Ordner vorhanden ist und über entsprechende Schreibberechtigungen verfügt. | Zeichenfolge |
| dpi | Die DPI-Auflösung (Punkte pro Zoll) für die generierten Bilder. Der Standardwert ist 200 dpi. | Int32 |
| Qualität | Die Qualitätsstufe der generierten Bilder im Bereich von 0 (am niedrigsten) bis 100 (am höchsten). Der Standardwert ist 95. | Int32 |
KonvertierenZuWort
Konvertiert ein PDF-Dokument in ein MicrosoftMicrosoft Azure Event Hubs Word-Dokument.
Rufen Sie diese Methode mit dem Dateipfad auf, in dem das konvertierte Word-Dokument gespeichert werden muss. Die Methode erstellt ein Word-Dokument aus dem PDF-Inhalt unter dem angegebenen Pfad.
| Parameter | Beschreibung | Datentyp |
|---|---|---|
| Word-Dateipfad | Der Dateipfad, in dem das konvertierte Word-Dokument (.doc) gespeichert wird. Stellen Sie sicher, dass der Dateipfad den Dateinamen und die Erweiterung enthält. | Zeichenfolge |
KonvertierenInXml
Konvertiert eine angegebene Seite eines PDF-Dokuments in das Microsoft XML-Format. Optional können nur Tabellen konvertiert werden, wenn angegeben.
Rufen Sie diese Methode mit der Seitenzahl der zu konvertierenden PDF-Datei, dem Dateipfad, in dem die XML-Ausgabe gespeichert werden muss, und legen Sie „ConvertTablesOnly“ optional auf „True“ fest, wenn nur Tabellen konvertiert werden müssen.
| Parameter | Beschreibung | Datentyp |
|---|---|---|
| PageNumber | Die Seitenzahl der PDF-Datei, die in das XML-Format konvertiert werden soll. Seitenzahlen beginnen normalerweise mit 1. | Int32 |
| XMLFilePath | Der Dateipfad, in dem das konvertierte XML-Dokument gespeichert wird. Stellen Sie sicher, dass der Dateipfad den Dateinamen und die Erweiterung enthält | Zeichenfolge |
| Nur konvertierenTabellen | Bei Festlegung auf „Wahr“ werden nur Tabellen der angegebenen Seite in XML konvertiert. Der Standardwert ist „Wahr“. | Boolean |
Bilder extrahieren
Extrahiert Bilder aus angegebenen Seiten eines PDF-Dokuments. Geben Sie optional den Ordnerpfad an, in dem die Bilder gespeichert werden, und eine Ausgabeliste zum Speichern der generierten Dateinamen.
Rufen Sie diese Methode mit dem Ordnerpfad, in dem die Bilder gespeichert werden müssen, den Start- und Endseitenzahlen, aus denen Bilder extrahiert werden sollen, und einer leeren Liste zum Speichern der Dateinamen der extrahierten Bilder auf.
| Parameter | Beschreibung | Datentyp |
|---|---|---|
| Ordnerpfad | Der Ordnerpfad, in dem die extrahierten Bilder gespeichert werden. Stellen Sie sicher, dass der Ordner vorhanden ist und über entsprechende Schreibberechtigungen verfügt. | Zeichenfolge |
| VonSeite | Die Nummer der ersten Seite, ab der Bilder extrahiert werden sollen. Seitenzahlen beginnen normalerweise mit 1. | Int32 |
| ToPage | Die Endseitenzahl, bis zu der Bilder extrahiert werden müssen. Diese Zahl muss größer als oder gleich der „FromPage “-Zahl sein. | Int32 |
| Dateinamen | Ein Ausgabeparameter, der die Dateinamen der extrahierten Bilder speichert. | Liste`1 |
GetAllTables
Extrahiert alle Tabellen aus einem PDF-Dokument und gibt sie als Liste von Datentabellen zurück.
Verwenden Sie den Rückgabeparameter, um die extrahierten Tabellendaten als Liste abzurufen.
Rufen Sie diese Methode ohne Parameter auf, um alle Tabellen aus dem PDF-Dokument abzurufen. Die Methode gibt eine Liste von DataTables zurück, wobei jede DataTable eine aus der PDF-Datei extrahierte Tabelle darstellt.
| Parameter | Beschreibung | Datentyp |
|---|---|---|
| Zurück | Diese Methode gibt eine Liste mit Datentabellen zurück, die eine aus der PDF-Datei extrahierte Tabelle darstellt. | Liste`1 |
GetPageAlsImage
Extrahiert Daten aus einer PDF-Dokumentseite und speichert sie als speicherinternes Bild.
Gibt eine angegebene Seite eines PDF-Dokuments als speicherinternes Bild zurück.
Rufen Sie diese Methode mit der Seitenzahl der PDF-Datei auf, um die Seite als Bild abzurufen. Die Methode gibt die Seite als System.Drawing.Image-Objekt zurück.
| Parameter | Beschreibung | Datentyp |
|---|---|---|
| PageNumber | Die Seitenzahl der PDF-Datei, die in ein Bild konvertiert werden soll. Seitenzahlen beginnen normalerweise mit 1. | Int32 |
| Zurück | Diese Methode gibt ein Bild zurück, das eine angegebene Seite der PDF-Datei darstellt. | Zeichnung.Bild |
GetPageCount
Ruft die Gesamtzahl der Seiten in einem PDF-Dokument ab. Sie müssen den Rückgabeparameter verwenden, um die Gesamtseitenanzahl in der PDF-Datei als Ganzzahl abzurufen.
| Parameter | Beschreibung | Datentyp |
|---|---|---|
| Zurück | Diese Methode gibt eine Ganzzahl zurück, die die Anzahl der Seiten der PDF-Datei darstellt. | Int32 |
GetTable
Extrahiert eine Tabelle aus einer PDF-Datei und gibt sie als DataTable zurück. Die Extraktionsmethode wird durch den Parameter „ExtractBy“ angegeben.
Rufen Sie diese Methode mit dem Extraktionstyp und dem entsprechenden Wert auf. Die Methode gibt die extrahierte Tabelle als DataTable zurück.
| Parameter | Beschreibung | Datentyp |
|---|---|---|
| ExtrahierenNach | Die zu verwendende Extraktionsmethode. Dieser Parameter muss „ExtractType“ sein, der die folgenden Optionen enthält: Index (0) – Extrahieren nach Seitenzahl und ContainsText (1) – Extrahieren nach übereinstimmendem Text. |
Extrakttyp |
| Wert | Der Wert, der dem Extraktionstyp entspricht. Wenn beispielsweise „ExtractBy“ auf „Index“ festgelegt ist, ist dies die Seitenzahl als Zeichenfolge. Wenn „ExtractBy“ auf „ContainsText“ festgelegt ist, ist dies der abzugleichende Text. |
Zeichenfolge |
| Zurück | Diese Methode gibt eine DataTable zurück, die eine aus der PDF-Datei extrahierte Tabelle darstellt. | Tabelle |
GetText
Ruft Text aus dem angegebenen Bereich von PDF-Seiten ab.
Rufen Sie diese Methode mit den Nummern der Start- und Endseite auf, um Text von diesen Seiten abzurufen. Die Methode gibt den extrahierten Text als Zeichenfolge zurück.
| Parameter | Beschreibung | Datentyp |
|---|---|---|
| VonSeite | Die Nummer der ersten Seite des Bereichs, aus dem Text extrahiert werden soll. Seitenzahlen beginnen normalerweise mit 1. | Int32 |
| ToPage | Die Seitenzahl, bis zu der Sie Text von der Startseite abrufen. Hinweis: Stellen Sie sicher, dass der Wert „ToPage“ höher als der Wert „FromPage“ ist. |
Int32 |
| Zurück | Diese Methode gibt eine Zeichenfolge zurück, die den Textinhalt der PDF-Datei darstellt. | Zeichenfolge |
Laden
Lädt eine PDF-Datei zur Interaktion und ermöglicht so weitere Vorgänge wie das Extrahieren von Inhalten.
Rufen Sie diese Methode mit dem vollständigen Pfad zur PDF-Datei (FilePath) auf, und geben Sie optional ein Passwort (Password) an, wenn die PDF-Datei geschützt ist.
| Parameter | Beschreibung | Datentyp |
|---|---|---|
| FilePath | Der vollständige Pfad zur zu ladenden PDF-Datei. Dies muss den Dateinamen und die Erweiterung enthalten. | Zeichenfolge |
| Passwort | Das Passwort für die PDF-Datei, wenn diese geschützt ist. Wenn die PDF-Datei nicht passwortgeschützt ist, kann dieser Parameter eine leere Zeichenfolge sein. | Zeichenfolge |
Zusammenfügung
Führt eine Liste von PDF-Dateien zu einer einzelnen PDF-Datei zusammen.
Rufen Sie diese Methode mit einer Liste der Dateipfade der zusammenzuführenden PDFs, dem Ausgabedateipfad und einer optionalen Überschreibkennzeichnung auf.
| Parameter | Beschreibung | Datentyp |
|---|---|---|
| Dateiliste | Eine Liste der Dateipfade für die zusammenzufügenden PDF-Dateien. Jeder Pfad muss ein gültiger Pfad zu einer PDF-Datei sein. | ArrayList |
| Ausgabedateipfad | Der Dateipfad, in dem die zusammengeführte PDF-Datei gespeichert wird. Dies muss den Dateinamen und die Erweiterung enthalten. | Zeichenfolge |
| Überschreiben | Bei Festlegung auf trueüberschreibt die Methode die vorhandene Datei im Ausgabepfad, falls sie vorhanden ist. Bei Festlegung auf Falseüberschreibt die Methode die vorhandene Datei nicht. Der Standardwert ist False. |
Boolean |
Teilen
Teilt eine einzelne PDF-Datei in mehrere Dateien auf, wobei jede Seite der PDF-Datei als separate Datei gespeichert wird.
Rufen Sie diese Methode mit dem Ausgabeordnerpfad auf, in dem die aufgeteilten PDF-Seiten gespeichert werden müssen.
| Parameter | Beschreibung | Datentyp |
|---|---|---|
| Ausgabeordnerpfad | Der Pfad zu dem Ordner, in dem die aufgeteilten PDF-Seiten gespeichert werden. Stellen Sie sicher, dass der Ordner vorhanden ist oder über entsprechende Berechtigungen zum Schreiben von Dateien verfügt. | Zeichenfolge |