PDF-Connector-Methoden

  • Freigeben Version: Yokohama
  • Aktualisiert 30. Januar 2025
  • 8 Minuten Lesedauer
  • Beschleunigen Sie die PDF-Verarbeitung für Ihre Dokumentautomatisierung mit den verschiedenen Methoden des PDF-Connectors in RPA Desktop Design Studio.

    Schließen

    Schließt die dem PDF-Dokument zugeordneten Ressourcen. Verwenden Sie diese Methode, um Referenzen und Ressourcen freizugeben, nachdem Sie die Lademethode verwendet haben.

    Rufen Sie diese Methode auf, wenn Sie das PDF-Dokument nicht mehr verwenden müssen oder nachdem Sie Vorgänge damit abgeschlossen haben.

    KonvertierenInExcel

    Konvertiert ein PDF-Dokument in ein MicrosoftMicrosoft Azure Event Hubs Excel-Dokument. Optional können nur Tabellen konvertiert werden, wenn angegeben.

    Rufen Sie diese Methode mit dem Dateipfad auf, in dem das konvertierte Excel-Dokument gespeichert werden muss, und legen Sie „ConvertTablesOnly“ optional auf „wahr“ fest, wenn nur Tabellen konvertiert werden müssen.

    Tabelle : 1. Parameter der Methode „ConvertToExcel“
    Parameter Beschreibung Datentyp
    Excel-Dateipfad Der Dateipfad, in dem das konvertierte Excel-Dokument (.xlsx) gespeichert wird. Stellen Sie sicher, dass der Dateipfad den Dateinamen und die Erweiterung enthält. Zeichenfolge
    Nur konvertierenTabellen Bei Festlegung auf truewerden nur Tabellen aus dem PDF-Dokument in Excel konvertiert. Der Standardwert ist true. Boolean

    KonvertierenInHTML

    Konvertiert eine angegebene Seite eines PDF-Formats in ein HTML-Format. Wenn die Seitenzahl kleiner oder gleich 0 ist, werden alle Seiten der PDF-Datei in HTML konvertiert.

    Rufen Sie diese Methode mit der Seitenzahl der PDF-Datei auf, die Sie in HTML konvertieren möchten. Wenn Sie eine Seitenzahl kleiner oder gleich 0 übergeben, wird die gesamte PDF-Datei in HTML konvertiert. Die Methode gibt den HTML-Inhalt als Zeichenfolge zurück.

    Tabelle : 2. Parameter der Methode „ConvertToHTML“
    Parameter Beschreibung Datentyp
    PageNumber (Dateneingang) Die Seitenzahl der PDF-Datei, die in HTML konvertiert werden soll. Wenn dieser Parameter kleiner oder gleich 0 ist, werden alle Seiten der PDF-Datei in HTML konvertiert. Seitenzahlen beginnen normalerweise mit 1. Int32
    Rückgabe (Datenausgabe) Diese Methode gibt den HTML-Inhalt als Zeichenfolge zurück, die den Inhalt der PDF-Datei darstellt. Zeichenfolge

    Bild konvertieren

    Konvertiert eine angegebene Seite eines PDF-Dokuments in ein Bild. Geben Sie optional den Bildpfad, in dem das Bild gespeichert wird, DPI (Punkte pro Zoll) und die Bildqualität an.

    Rufen Sie diese Methode mit der Seitenzahl der zu konvertierenden PDF-Datei, dem Dateipfad, unter dem das Bild gespeichert werden muss, und optional die Parameter für DPI und Bildqualität an.

    Tabelle : 3. Parameter der Methode „ConvertToImage“
    Parameter Beschreibung Datentyp
    PageNumber Die Seitenzahl der PDF-Datei, die in ein Bild konvertiert werden soll. Seitenzahlen beginnen normalerweise mit 1. Int32
    ImagePath Der Dateipfad, in dem das konvertierte Bild gespeichert wird. Stellen Sie sicher, dass der Dateipfad den Dateinamen und die Erweiterung enthält Zeichenfolge
    dpi Die DPI-Auflösung (Punkte pro Zoll) für das generierte Bild. Der Standardwert ist 200 dpi. Int32
    Qualität Die Qualitätsstufe des generierten Bildes im Bereich von 0 (am niedrigsten) bis 100 (am höchsten). Der Standardwert ist 95. Int32

    ImagesToImages konvertieren

    Konvertiert ein PDF-Dokument in Bilder. Geben Sie optional den Ordnerpfad zum Speichern der Bilder, DPI (Punkte pro Zoll), Bildqualität und eine optionale Liste zum Speichern der generierten Dateinamen an.

    Rufen Sie diese Methode mit dem Ordnerpfad auf, in dem die Bilder gespeichert werden müssen. Passen Sie optional die Parameter für DPI und Bildqualität an. Wenn Sie eine Liste als Parameter FileNames angeben, wird sie mit den Namen der generierten Bilddateien ausgefüllt.

    Tabelle : 4. Parameter der Methode „ConvertToImages“
    Parameter Beschreibung Datentyp
    Ordnerpfad Der Ordnerpfad, in dem die konvertierten Bilder gespeichert werden. Stellen Sie sicher, dass der Ordner vorhanden ist und über entsprechende Schreibberechtigungen verfügt. Zeichenfolge
    dpi Die DPI-Auflösung (Punkte pro Zoll) für die generierten Bilder. Der Standardwert ist 200 dpi. Int32
    Qualität Die Qualitätsstufe der generierten Bilder im Bereich von 0 (am niedrigsten) bis 100 (am höchsten). Der Standardwert ist 95. Int32

    KonvertierenZuWort

    Konvertiert ein PDF-Dokument in ein MicrosoftMicrosoft Azure Event Hubs Word-Dokument.

    Rufen Sie diese Methode mit dem Dateipfad auf, in dem das konvertierte Word-Dokument gespeichert werden muss. Die Methode erstellt ein Word-Dokument aus dem PDF-Inhalt unter dem angegebenen Pfad.

    Tabelle : 5. Parameter der Methode „ConvertToWord“
    Parameter Beschreibung Datentyp
    Word-Dateipfad Der Dateipfad, in dem das konvertierte Word-Dokument (.doc) gespeichert wird. Stellen Sie sicher, dass der Dateipfad den Dateinamen und die Erweiterung enthält. Zeichenfolge

    KonvertierenInXml

    Konvertiert eine angegebene Seite eines PDF-Dokuments in das Microsoft XML-Format. Optional können nur Tabellen konvertiert werden, wenn angegeben.

    Rufen Sie diese Methode mit der Seitenzahl der zu konvertierenden PDF-Datei, dem Dateipfad, in dem die XML-Ausgabe gespeichert werden muss, und legen Sie „ConvertTablesOnly“ optional auf „True“ fest, wenn nur Tabellen konvertiert werden müssen.

    Tabelle : 6. Parameter der Methode „ConvertToXml“
    Parameter Beschreibung Datentyp
    PageNumber Die Seitenzahl der PDF-Datei, die in das XML-Format konvertiert werden soll. Seitenzahlen beginnen normalerweise mit 1. Int32
    XMLFilePath Der Dateipfad, in dem das konvertierte XML-Dokument gespeichert wird. Stellen Sie sicher, dass der Dateipfad den Dateinamen und die Erweiterung enthält Zeichenfolge
    Nur konvertierenTabellen Bei Festlegung auf „Wahr“ werden nur Tabellen der angegebenen Seite in XML konvertiert. Der Standardwert ist „Wahr“. Boolean

    Bilder extrahieren

    Extrahiert Bilder aus angegebenen Seiten eines PDF-Dokuments. Geben Sie optional den Ordnerpfad an, in dem die Bilder gespeichert werden, und eine Ausgabeliste zum Speichern der generierten Dateinamen.

    Rufen Sie diese Methode mit dem Ordnerpfad, in dem die Bilder gespeichert werden müssen, den Start- und Endseitenzahlen, aus denen Bilder extrahiert werden sollen, und einer leeren Liste zum Speichern der Dateinamen der extrahierten Bilder auf.

    Tabelle : 7. Parameter für die Methode „ExtractImages“
    Parameter Beschreibung Datentyp
    Ordnerpfad Der Ordnerpfad, in dem die extrahierten Bilder gespeichert werden. Stellen Sie sicher, dass der Ordner vorhanden ist und über entsprechende Schreibberechtigungen verfügt. Zeichenfolge
    VonSeite Die Nummer der ersten Seite, ab der Bilder extrahiert werden sollen. Seitenzahlen beginnen normalerweise mit 1. Int32
    ToPage Die Endseitenzahl, bis zu der Bilder extrahiert werden müssen. Diese Zahl muss größer als oder gleich der „FromPage “-Zahl sein. Int32
    Dateinamen Ein Ausgabeparameter, der die Dateinamen der extrahierten Bilder speichert. Liste`1

    GetAllTables

    Extrahiert alle Tabellen aus einem PDF-Dokument und gibt sie als Liste von Datentabellen zurück.

    Verwenden Sie den Rückgabeparameter, um die extrahierten Tabellendaten als Liste abzurufen.

    Rufen Sie diese Methode ohne Parameter auf, um alle Tabellen aus dem PDF-Dokument abzurufen. Die Methode gibt eine Liste von DataTables zurück, wobei jede DataTable eine aus der PDF-Datei extrahierte Tabelle darstellt.

    Tabelle : 8. Parameter der GetAllTables-Methode
    Parameter Beschreibung Datentyp
    Zurück Diese Methode gibt eine Liste mit Datentabellen zurück, die eine aus der PDF-Datei extrahierte Tabelle darstellt. Liste`1

    GetPageAlsImage

    Extrahiert Daten aus einer PDF-Dokumentseite und speichert sie als speicherinternes Bild.

    Gibt eine angegebene Seite eines PDF-Dokuments als speicherinternes Bild zurück.

    Rufen Sie diese Methode mit der Seitenzahl der PDF-Datei auf, um die Seite als Bild abzurufen. Die Methode gibt die Seite als System.Drawing.Image-Objekt zurück.

    Tabelle : 9. Parameter der GetPageAsImage-Methode
    Parameter Beschreibung Datentyp
    PageNumber Die Seitenzahl der PDF-Datei, die in ein Bild konvertiert werden soll. Seitenzahlen beginnen normalerweise mit 1. Int32
    Zurück Diese Methode gibt ein Bild zurück, das eine angegebene Seite der PDF-Datei darstellt. Zeichnung.Bild

    GetPageCount

    Ruft die Gesamtzahl der Seiten in einem PDF-Dokument ab. Sie müssen den Rückgabeparameter verwenden, um die Gesamtseitenanzahl in der PDF-Datei als Ganzzahl abzurufen.

    Tabelle : 10. Parameter der GetPageCount-Methode
    Parameter Beschreibung Datentyp
    Zurück Diese Methode gibt eine Ganzzahl zurück, die die Anzahl der Seiten der PDF-Datei darstellt. Int32

    GetTable

    Extrahiert eine Tabelle aus einer PDF-Datei und gibt sie als DataTable zurück. Die Extraktionsmethode wird durch den Parameter „ExtractBy“ angegeben.

    Rufen Sie diese Methode mit dem Extraktionstyp und dem entsprechenden Wert auf. Die Methode gibt die extrahierte Tabelle als DataTable zurück.

    Tabelle : 11. Parameter der GetTable-Methode
    Parameter Beschreibung Datentyp
    ExtrahierenNach Die zu verwendende Extraktionsmethode.

    Dieser Parameter muss „ExtractType“ sein, der die folgenden Optionen enthält: Index (0) – Extrahieren nach Seitenzahl und ContainsText (1) – Extrahieren nach übereinstimmendem Text.

    Extrakttyp
    Wert Der Wert, der dem Extraktionstyp entspricht.

    Wenn beispielsweise „ExtractBy“ auf „Index“ festgelegt ist, ist dies die Seitenzahl als Zeichenfolge. Wenn „ExtractBy“ auf „ContainsText“ festgelegt ist, ist dies der abzugleichende Text.

    Zeichenfolge
    Zurück Diese Methode gibt eine DataTable zurück, die eine aus der PDF-Datei extrahierte Tabelle darstellt. Tabelle

    GetText

    Ruft Text aus dem angegebenen Bereich von PDF-Seiten ab.

    Rufen Sie diese Methode mit den Nummern der Start- und Endseite auf, um Text von diesen Seiten abzurufen. Die Methode gibt den extrahierten Text als Zeichenfolge zurück.

    Tabelle : 12. Parameter der GetText-Methode
    Parameter Beschreibung Datentyp
    VonSeite Die Nummer der ersten Seite des Bereichs, aus dem Text extrahiert werden soll. Seitenzahlen beginnen normalerweise mit 1. Int32
    ToPage Die Seitenzahl, bis zu der Sie Text von der Startseite abrufen.
    Hinweis:
    Stellen Sie sicher, dass der Wert „ToPage“ höher als der Wert „FromPage“ ist.
    Int32
    Zurück Diese Methode gibt eine Zeichenfolge zurück, die den Textinhalt der PDF-Datei darstellt. Zeichenfolge

    Laden

    Lädt eine PDF-Datei zur Interaktion und ermöglicht so weitere Vorgänge wie das Extrahieren von Inhalten.

    Rufen Sie diese Methode mit dem vollständigen Pfad zur PDF-Datei (FilePath) auf, und geben Sie optional ein Passwort (Password) an, wenn die PDF-Datei geschützt ist.

    Tabelle : 13. Parameter der Lademethode
    Parameter Beschreibung Datentyp
    FilePath Der vollständige Pfad zur zu ladenden PDF-Datei. Dies muss den Dateinamen und die Erweiterung enthalten. Zeichenfolge
    Passwort Das Passwort für die PDF-Datei, wenn diese geschützt ist. Wenn die PDF-Datei nicht passwortgeschützt ist, kann dieser Parameter eine leere Zeichenfolge sein. Zeichenfolge

    Zusammenfügung

    Führt eine Liste von PDF-Dateien zu einer einzelnen PDF-Datei zusammen.

    Rufen Sie diese Methode mit einer Liste der Dateipfade der zusammenzuführenden PDFs, dem Ausgabedateipfad und einer optionalen Überschreibkennzeichnung auf.

    Tabelle : 14. Parameter der Zusammenführungsmethode
    Parameter Beschreibung Datentyp
    Dateiliste Eine Liste der Dateipfade für die zusammenzufügenden PDF-Dateien. Jeder Pfad muss ein gültiger Pfad zu einer PDF-Datei sein. ArrayList
    Ausgabedateipfad Der Dateipfad, in dem die zusammengeführte PDF-Datei gespeichert wird. Dies muss den Dateinamen und die Erweiterung enthalten. Zeichenfolge
    Überschreiben Bei Festlegung auf trueüberschreibt die Methode die vorhandene Datei im Ausgabepfad, falls sie vorhanden ist. Bei Festlegung auf Falseüberschreibt die Methode die vorhandene Datei nicht.

    Der Standardwert ist False.

    Boolean
    Hinweis:
    Wenn die PDF-Dateien passwortgeschützt sind oder im Parameter „FileList“ ein falsches Format angegeben haben, zeigt die Automatisierung einen Fehler an.

    Teilen

    Teilt eine einzelne PDF-Datei in mehrere Dateien auf, wobei jede Seite der PDF-Datei als separate Datei gespeichert wird.

    Rufen Sie diese Methode mit dem Ausgabeordnerpfad auf, in dem die aufgeteilten PDF-Seiten gespeichert werden müssen.

    Tabelle : 15. Parameter der Split-Methode
    Parameter Beschreibung Datentyp
    Ausgabeordnerpfad Der Pfad zu dem Ordner, in dem die aufgeteilten PDF-Seiten gespeichert werden. Stellen Sie sicher, dass der Ordner vorhanden ist oder über entsprechende Berechtigungen zum Schreiben von Dateien verfügt. Zeichenfolge