PDF コネクタのメソッド

  • リリースバージョン: Yokohama
  • 更新日 2025年01月30日
  • 所要時間:10分
  • RPA デスクトップデザインスタジオ での PDF コネクタのさまざまなメソッドを使用することで、ドキュメント自動化の PDF 処理を高速化します。

    クローズ

    PDF ドキュメントに関連付けられているリソースを閉じます。Load メソッドを使用した後に参照とリソースを解放するには、このメソッドを使用します。

    このメソッドは、PDF ドキュメントを使用する必要がなくなった場合、または操作が完了した後に呼び出します。

    ConvertToExcel

    PDF ドキュメントを Microsoft Excel ドキュメントに変換します。オプションで、指定した場合はテーブルのみを変換できます。

    変換された Excel ドキュメントを保存する必要があるファイルパスを指定してこのメソッドを呼び出し、テーブルのみを変換する必要がある場合は、オプションで [ConvertTablesOnly][True] に設定します。

    表 : 1. ConvertToExcel メソッドのパラメーター
    パラメーター 説明 データタイプ
    ExcelFilePath 変換された Excel ドキュメント (.xlsx) が保存されるファイルパス。ファイルパスにファイル名と拡張子が含まれていることを確認します。 文字列
    ConvertTablesOnly [True] に設定すると、PDF ドキュメントのテーブルのみが Excel に変換されます。デフォルトは [True] です。 ブーリアン

    ConvertToHTML

    PDF の指定されたページを HTML 形式に変換します。ページ番号が 0 以下の場合、PDF のすべてのページが HTML に変換されます。

    HTML に変換する PDF のページ番号を指定して、このメソッドを呼び出します。0 以下のページ番号を渡すと、PDF 全体が HTML に変換されます。このメソッドは、HTML コンテンツを文字列として返します。

    表 : 2. ConvertToHTML メソッドのパラメーター
    パラメーター 説明 データタイプ
    PageNumber (データ入力) HTML に変換される PDF のページ番号。このパラメーターが 0 以下の場合、PDF のすべてのページが HTML に変換されます。通常、ページ番号は 1 から始まります。 Int32
    Return (データ出力) このメソッドは、PDF ファイルのコンテンツを表す文字列として HTML コンテンツを返します。 文字列

    ConvertToImage

    PDF ドキュメントの指定されたページを画像に変換します。必要に応じて、画像が保存される画像のパス、DPI (インチあたりのドット数)、および画質を指定します。

    変換する PDF のページ番号、画像を保存する必要があるファイルパスを指定してこのメソッドを呼び出し、オプションで DPI と画質のパラメーターを調整します。

    表 : 3. ConvertToImage メソッドのパラメーター
    パラメーター 説明 データタイプ
    PageNumber 画像に変換される PDF のページ番号。通常、ページ番号は 1 から始まります。 Int32
    ImagePath 変換された画像が保存されるファイルパス。ファイルパスにファイル名と拡張子が含まれていることを確認します。 文字列
    Dpi 生成された画像の DPI (インチあたりのドット数) 解像度。既定値は 200 DPI です。 Int32
    品質 範囲が 0 (最低) から 100 (最高) の生成された画像の品質レベル。デフォルトは 95 です。 Int32

    ConvertToImages

    PDF ドキュメントを画像に変換します。必要に応じて、画像が保存されるフォルダーパス、DPI (インチあたりのドット数)、画質、生成されたファイル名を保存するオプションのリストを指定します。

    画像を保存する必要があるフォルダーパスを指定して、このメソッドを呼び出します。必要に応じて、DPI と画質のパラメーターを調整します。[FileNames] パラメーターとしてリストを指定すると、生成された画像ファイルの名前が入力されます。

    表 : 4. ConvertToImages メソッドのパラメーター
    パラメーター 説明 データタイプ
    Folderpath 変換された画像が保存されるフォルダーパス。フォルダーが存在し、適切な書き込み権限があることを確認します。 文字列
    Dpi 生成された画像の DPI (インチあたりドット数) 解像度。既定値は 200 DPI です。 Int32
    品質 範囲が 0 (最低) から 100 (最高) の生成された画像の品質レベル。デフォルトは 95 です。 Int32

    ConvertToWord

    PDF を Microsoft Word ドキュメントに変換します。

    変換された Word ドキュメントを保存する必要があるファイルパスを指定して、このメソッドを呼び出します。このメソッドは、指定されたパスの PDF コンテンツから Word ドキュメントを作成します。

    表 : 5. ConvertToWord メソッドのパラメーター
    パラメーター 説明 データタイプ
    WordFilepath 変換された Word ドキュメント (.doc) が保存されるファイルパス。ファイルパスにファイル名と拡張子が含まれていることを確認します。 文字列

    ConvertToXml

    PDF ドキュメントの指定されたページを Microsoft XML 形式に変換します。オプションで、指定した場合はテーブルのみを変換できます。

    変換する PDF のページ番号、XML 出力を保存する必要があるファイルパスを指定してこのメソッドを呼び出し、テーブルのみを変換する必要がある場合はオプションで ConvertTablesOnlyTrue に設定します。

    表 : 6. ConvertToXml メソッドのパラメーター
    パラメーター 説明 データタイプ
    PageNumber XML 形式に変換される PDF のページ番号。通常、ページ番号は 1 から始まります。 Int32
    XmlFilePath 変換された XML ドキュメントが保存されるファイルパス。ファイルパスにファイル名と拡張子が含まれていることを確認します。 文字列
    ConvertTablesOnly True に設定すると、指定したページのテーブルのみが XML に変換されます。デフォルトは [True] です。 ブーリアン

    ExtractImages

    PDF ドキュメントの指定されたページから画像を抽出します。必要に応じて、画像が保存されるフォルダーパスと、生成されたファイル名を保存する出力リストを指定します。

    画像を保存する必要があるフォルダーパス、画像を抽出する開始ページ番号と終了ページ番号、抽出した画像のファイル名を格納する空のリストを指定して、このメソッドを呼び出します。

    表 : 7. ExtractImages メソッドのパラメーター
    パラメーター 説明 データタイプ
    Folderpath 抽出された画像が保存されるフォルダーパス。フォルダーが存在し、適切な書き込み権限があることを確認します。 文字列
    FromPage 画像を抽出する開始ページ番号。通常、ページ番号は 1 から始まります。 Int32
    ToPage 画像を抽出する終了ページ番号。この数値は、[FromPage] の数値以上でなければなりません。 Int32
    FileNames 抽出された画像のファイル名を格納する出力パラメーター。 List1

    GetAllTables

    PDF ドキュメントからすべてのテーブルを抽出し、DataTable のリストとして返します。

    [Return] パラメーターを使用して、抽出されたテーブルデータをリストとして取得します。

    パラメーターを指定せずにこのメソッドを呼び出して、PDF ドキュメントからすべてのテーブルを取得します。このメソッドは DataTable のリストを返します。各 DataTable は PDF から抽出されたテーブルを表します。

    表 : 8. GetAllTables メソッドのパラメーター
    パラメーター 説明 データタイプ
    Return このメソッドは、PDF ファイルから抽出されたテーブルを表す DataTable のリストを返します。 List1

    GetPageAsImage

    PDF ドキュメントページからデータを抽出し、インメモリ画像として保存します。

    PDF ドキュメントの指定されたページをインメモリ画像として返します。

    PDF のページ番号を指定してこのメソッドを呼び出し、ページを画像として取得します。このメソッドは、ページを System.Drawing.Image オブジェクトとして返します。

    表 : 9. GetPageAsImage メソッドのパラメーター
    パラメーター 説明 データタイプ
    PageNumber 画像に変換される PDF のページ番号。通常、ページ番号は 1 から始まります。 Int32
    Return このメソッドは、PDF ファイルの指定されたページを表す画像を返します。 Drawing.Image

    GetPageCount

    PDF ドキュメントの総ページ数を取得します。PDF の総ページ数を整数として取得するために、[Return] パラメーターを使用する必要があります。

    表 : 10. GetPageCount メソッドのパラメーター
    パラメーター 説明 データタイプ
    Return このメソッドは、PDF ファイルのページ数を表す整数を返します。 Int32

    GetTable

    PDF からテーブルを抽出し、DataTable として返します。抽出メソッドは ExtractBy パラメーターで指定します。

    抽出タイプと対応する値を使用して、このメソッドを呼び出します。このメソッドは、抽出されたテーブルを DataTable として返します。

    表 : 11. GetTable メソッドのパラメーター
    パラメーター 説明 データタイプ
    ExtractBy 使用する抽出メソッド。

    このパラメーターは ExtractType である必要があり、次のオプションが含まれます。Index (0) - ページ番号で抽出、ContainsText (1) - 一致するテキストで抽出。

    ExtractType
    抽出タイプに対応する値。

    たとえば、ExtractBy が Index の場合、これは文字列としてのページ番号になります。ExtractBy が ContainsText の場合、これは一致するテキストになります。

    文字列
    Return このメソッドは、PDF ファイルから抽出されたテーブルを表す DataTable を返します。 テーブル

    GetText

    指定された範囲の PDF ページからテキストを取得します。

    開始ページ番号と終了ページ番号を指定してこのメソッドを呼び出し、それらのページからテキストを取得します。このメソッドは、抽出されたテキストを文字列として返します。

    表 : 12. GetText メソッドのパラメーター
    パラメーター 説明 データタイプ
    FromPage テキストを抽出する範囲の開始ページ番号。通常、ページ番号は 1 から始まります。 Int32
    ToPage 開始ページからどのページまでテキストを取得するかを入力します。
    注:
    ToPage 値が [FromPage] の値よりも大きいことを確認します。
    Int32
    Return このメソッドは、PDF ファイルのテキストコンテンツを表す文字列を返します。 文字列

    Load

    インタラクションのために PDF ファイルをロードし、コンテンツの抽出などの追加の操作を有効にします。

    PDF ファイルへのフルパス (FilePath) を指定してこのメソッドを呼び出し、PDF が保護されている場合はオプションでパスワード (Password) を指定します。

    表 : 13. Load メソッドのパラメーター
    パラメーター 説明 データタイプ
    FilePath ロードする PDF ファイルへのフルパス。ファイル名と拡張子を含める必要があります。 文字列
    パスワード PDF ファイルが保護されている場合のパスワード。PDF がパスワードで保護されていない場合、このパラメーターは空の文字列にすることができます。 文字列

    Merge

    複数の PDF ファイルのリストを 1 つの PDF ファイルに結合します。

    結合する PDF のファイルパスのリスト、出力ファイルパス、オプションの上書きフラグを指定して、このメソッドを呼び出します。

    表 : 14. Merge メソッドのパラメーター
    パラメーター 説明 データタイプ
    FileList 結合する PDF ファイルのファイルパスのリスト。各パスは、PDF ファイルへの有効なパスである必要があります。 ArrayList
    OutputFilePath 結合された PDF が保存されるファイルパス。ファイル名と拡張子を含める必要があります。 文字列
    Overwrite [True] に設定すると、出力パスに既存のファイルが存在する場合は上書きされます。[False] に設定すると、メソッドは既存のファイルを上書きしません。

    デフォルトは [False] です。

    Boolean
    注:
    PDF ファイルがパスワードで保護されている場合、または [FileList] パラメーターの形式が間違っている場合、自動化によってエラーが表示されます。

    Split

    1 つの PDF を複数のファイルに分割し、PDF の各ページを個別のファイルとして保存します。

    分割された PDF ページを保存する必要がある出力フォルダーパスを指定して、このメソッドを呼び出します。

    表 : 15. Split メソッドのパラメーター
    パラメーター 説明 データタイプ
    OutputFolderPath 分割された PDF ページが保存されるフォルダーへのパスです。フォルダーが存在するか、ファイルを書き込むための適切な権限があることを確認します。 文字列