PDF-Connector-Methoden

  • Freigeben Version: Washingtondc
  • Aktualisiert 1. Februar 2024
  • 4 Minuten Lesedauer
  • Beschleunigen Sie die PDF-Verarbeitung für Ihre Dokumentautomatisierung mithilfe der verschiedenen Methoden des PDF-Connectors in RPA Desktop Design Studio.

    Laden

    Lädt eine PDF-Datei in die Automatisierung. Verwenden Sie diese Methode, um die PDF-Datei in die Automatisierung zu laden, bevor Sie andere PDF-Methoden verwenden.

    Verwenden Sie den Parameter FilePath, um den Pfad der PDF-Datei einzugeben. Dieses Feld ist erforderlich, um diese Methode auszuführen.

    ConvertToWord

    Konvertiert eine PDF-Datei in ein Microsoft Word-Dokument. Sie müssen den Parameter WordFilePath verwenden, um den Ausgabedateipfad für die konvertierte Microsoft Word-Datei festzulegen.

    ConvertToExcel

    Konvertiert ein PDF-Dokument in ein Microsoft Excel-Dokument. Sie müssen den Parameter ExcelFilePath verwenden, um den Ausgabedateipfad für die konvertierte Microsoft Excel-Datei festzulegen.

    ConvertToHTML

    Konvertiert ein PDF-Dokument in ein HTML-Dokument.

    Tabelle : 1. Parameter der ConvertToHTML-Methode
    Parameter Beschreibung Erforderlich oder nicht
    Seitenzahl Seitenzahl des PDF-Dokuments, das in eine HTML-Seite konvertiert wird. Ja
    UseSameFontSize Überprüft, ob für die Konvertierung in das HTML-Format dieselbe Schriftgröße verwendet werden muss. Der Standardwert ist auf „false“ festgelegt. Nein

    ConvertToImage

    Konvertiert ein PDF-Dokument in ein XML-Dokument.

    Tabelle : 2. Parameter der ConvertToImage-Methode
    Parameter Beschreibung Erforderlich oder nicht
    Ordnerpfad Verwendet den Pfad zu dem Ordner, in dem die Komponente die PDF-Datei als Bild aus einer zuvor ausgeführten Komponente speichert. Ja
    Dpi Übernimmt den DPI-Wert (Punkte pro Zoll) aus einer zuvor ausgeführten Komponente. Nein
    Qualität Übernimmt den Wert, der die Qualität des Bildes angibt, von einer zuvor ausgeführten Komponente. Nein
    Dateinamen Gibt den Pfad und den Namen des gespeicherten Bildes zurück und übergibt an die nächste Komponente.

    Wenn die Quell-PDF-Datei mehrere Seiten enthält, erstellt die Komponente Bilder für jede Seite.

    Ja

    ConvertToImages

    Konvertiert die Seiten eines PDF-Dokuments in Bilder.

    Tabelle : 3. Parameter der ConvertToImages-Methode
    Parameter Beschreibung Erforderlich oder nicht?
    ImagePath Verwendet den Pfad zu dem Speicherort auf dem lokalen Laufwerk, an dem die Komponente die Images einer zuvor ausgeführten Komponente speichert. Ja
    Seitenzahl Übernimmt die Seitenzahl der PDF-Datei aus einer zuvor ausgeführten Komponente. Nein
    Dpi Übernimmt die Punkte pro Zoll (DPI) aus einer zuvor ausgeführten Komponente. Je höher der Wert, desto besser die Qualität der gespeicherten Bilder. Nein
    Qualität Übernimmt den Wert, der die Qualität der Bilder aus einer zuvor ausgeführten Komponente angibt. Je höher der Wert, desto besser die Qualität der gespeicherten Bilder. Nein

    ConvertToTables

    Konvertieren Sie den Inhalt eines PDF-Dokuments in ein Tabellenformat. Verwenden Sie den Rückgabeparameter, um die Daten in der PDF-Datei abzurufen, die in Tabellenelementen wie Überschriften und Spalten organisiert ist.

    ConvertToXml

    Konvertiert ein PDF-Dokument in ein XML-Dokument.

    Tabelle : 4. Parameter der ConvertToXml-Methode
    Parameter Beschreibung Erforderlich oder nicht?
    XML-Dateipfad Übernimmt den Zielpfad für die XML-Datei aus einer zuvor ausgeführten Komponente. Ja
    ConvertTablesOnly Verwendet den booleschen Wert, um anzugeben, ob die Komponente nur die Tabellen im PDF-Dokument konvertiert. Nein
    Seitenzahl Übernimmt die Seitenzahl des PDF-Dokuments, um die Seite aus einer zuvor ausgeführten Komponente in ein XML-Dokument zu konvertieren. Nein

    Bilder extrahieren

    Extrahiert eine oder mehrere PDF-Dokumentseiten als Bilder und speichert sie.

    Tabelle : 5. Parameter für die Methode „ExtractImages“.
    Parameter Beschreibung Erforderlich oder nicht?
    Ordnerpfad Verwendet den Zielpfad, in dem die extrahierten Images aus einer zuvor ausgeführten Komponente gespeichert werden. Ja
    Seitenzahl Verwendet die Seitenzahl des PDF-Dokuments, um diese Seite nur aus einer zuvor ausgeführten Komponente zu extrahieren. Nein. Die Verbindung des Ports ist optional.
    Dateinamen Gibt den Pfad und die Namen der extrahierten Images zurück und übergibt an die nächsten Komponenten. Ja

    RuftAlleTabellen ab

    Ruft alle Tabellendaten in einem PDF-Dokument als Liste ab. Verwenden Sie den Rückgabeparameter, um die extrahierten Tabellendaten als Liste abzurufen.

    GetPageAlsImage

    Extrahiert Daten aus einer PDF-Dokumentseite und speichert sie als In-Memory Image.

    Tabelle : 6. Parameter der GetPageAsImage-Methode
    Parameter Beschreibung Erforderlich oder nicht?
    Seitenzahl Verwendet die Seitenzahl des PDF-Dokuments, um diese Seite nur aus einer zuvor ausgeführten Komponente zu extrahieren. Nein. Die Verbindung des Ports ist optional.
    Zurück Gibt das In-Memory-Image als Bitmap zurück und übergibt es an die nächste Komponente. Ja

    Seitenanzahl abrufen

    Ruft die Gesamtzahl der Seiten in einem PDF-Dokument ab. Sie müssen den Parameter Rückgabe verwenden, um die Gesamtseitenanzahl in der PDF-Datei als Ganzzahl abzurufen.

    GetTable

    Extrahiert alle Tabellen aus einem PDF-Dokument und gibt die tabellarischen Daten als Datentabelle zurück.

    Tabelle : 7. Parameter der GetTable-Methode
    Parameter Beschreibung Erforderlich oder nicht?
    Extrahieren nach Übernimmt den Pfad zum PDF-Dokument aus einer zuvor ausgeführten Komponente. Ja
    Wert Das Format der Tabelle. Beispiel: Zeichenfolge. Nein
    Zurück Gibt die Tabellen einer Datentabelle zurück. Nein

    GetText

    Extrahiert Text aus einem PDF-Dokument

    Tabelle : 8. Parameter der GetText-Methode
    Parameter Beschreibung Erforderlich oder nicht?
    FromPage Die Seitenzahl, um mit dem Abrufen des Texts zu beginnen. Verwenden Sie diese Option, wenn Sie Text zwischen einem Seitenbereich abrufen möchten. Der Standardwert ist null. Nein
    Zielseite Die Seitenzahl, bis zu der Sie Text von der Startseite abrufen.
    Hinweis:
    Stellen Sie sicher, dass der ToPage-Wert höher als der FromPage- Wert ist.
    Nein
    Zurück Gibt den extrahierten Text als Zeichenfolge zurück und übergibt an die nächste Komponente. Ja

    Laden

    Lädt eine PDF-Datei in die Automatisierung. Verwenden Sie diese Methode, um die PDF-Datei in die Automatisierung zu laden, bevor Sie andere PDF-Methoden verwenden.

    Tabelle : 9. Parameter der Load-Methode
    Parameter Beschreibung Erforderlich oder nicht?
    FilePath Pfad der PDF-Datei Ja
    Passwort Passwort für das Dokument, wenn es passwortgeschützt ist. Nein

    Zusammenfügung

    Kombiniert mehrere PDF-Dateien.
    Tabelle : 10. Parameter der Zusammenführungsmethode
    Parameter Beschreibung Erforderlich oder nicht?
    Dateiliste Liste der PDF-Dateien, die Sie zusammenführen möchten. Die Dateien sollten in einem Array-Format aufgelistet werden. Ja
    Ausgabedateipfad Pfad zum Generieren der zusammengeführten Ausgabe der PDF-Dateien. Ja
    Überschreiben Überschreibt eine Datei im Ausgabeverzeichnis, wenn die Datei denselben Namen hat wie im Parameter „OutputFilePath“ angegeben. Der Standardwert ist auf Nein festgelegt. Nein
    Hinweis:
    Wenn die PDF-Dateien passwortgeschützt sind oder im Parameter FileList ein falsches Format aufweisen, zeigt die Automatisierung einen Fehler an.

    Teilen

    Teilt eine einzelne PDF-Datei in mehrere PDF-Dateien auf. Jede Seite einer PDF-Datei wird als separate PDF-Datei generiert. Verwenden Sie den Parameter AusgabeFolderPath, um den Pfad anzugeben, in dem Sie die Dateien generieren möchten.

    Schließen

    Schließt die Verweise auf die PDF-Datei, die Sie mit der Load-Methode in die Automatisierung laden.