PDF コネクタのメソッド

クローズ

PDF ドキュメントに関連付けられているリソースを閉じます。Load メソッドを使用した後に参照とリソースを解放するには、このメソッドを使用します。

このメソッドは、PDF ドキュメントを使用する必要がなくなった場合、または操作が完了した後に呼び出します。

ConvertToExcel

PDF ドキュメントを Microsoft Excel ドキュメントに変換します。オプションで、指定した場合はテーブルのみを変換できます。

変換された Excel ドキュメントを保存する必要があるファイルパスを指定してこのメソッドを呼び出し、テーブルのみを変換する必要がある場合は、オプションで [ConvertTablesOnly] を [True] に設定します。

表 : 1. ConvertToExcel メソッドのパラメーター
パラメーター	説明	データタイプ
ExcelFilePath	変換された Excel ドキュメント (.xlsx) が保存されるファイルパス。ファイルパスにファイル名と拡張子が含まれていることを確認します。	文字列
ConvertTablesOnly	[True] に設定すると、PDF ドキュメントのテーブルのみが Excel に変換されます。デフォルトは [True] です。	ブーリアン

ConvertToHTML

PDF の指定されたページを HTML 形式に変換します。ページ番号が 0 以下の場合、PDF のすべてのページが HTML に変換されます。

HTML に変換する PDF のページ番号を指定して、このメソッドを呼び出します。0 以下のページ番号を渡すと、PDF 全体が HTML に変換されます。このメソッドは、HTML コンテンツを文字列として返します。

表 : 2. ConvertToHTML メソッドのパラメーター
パラメーター	説明	データタイプ
PageNumber (データ入力)	HTML に変換される PDF のページ番号。このパラメーターが 0 以下の場合、PDF のすべてのページが HTML に変換されます。通常、ページ番号は 1 から始まります。	Int32
Return (データ出力)	このメソッドは、PDF ファイルのコンテンツを表す文字列として HTML コンテンツを返します。	文字列

ConvertToImage

PDF ドキュメントの指定されたページを画像に変換します。必要に応じて、画像が保存される画像のパス、DPI (インチあたりのドット数)、および画質を指定します。

変換する PDF のページ番号、画像を保存する必要があるファイルパスを指定してこのメソッドを呼び出し、オプションで DPI と画質のパラメーターを調整します。

表 : 3. ConvertToImage メソッドのパラメーター
パラメーター	説明	データタイプ
PageNumber	画像に変換される PDF のページ番号。通常、ページ番号は 1 から始まります。	Int32
ImagePath	変換された画像が保存されるファイルパス。ファイルパスにファイル名と拡張子が含まれていることを確認します。	文字列
Dpi	生成された画像の DPI (インチあたりのドット数) 解像度。既定値は 200 DPI です。	Int32
品質	範囲が 0 (最低) から 100 (最高) の生成された画像の品質レベル。デフォルトは 95 です。	Int32

ConvertToImages

PDF ドキュメントを画像に変換します。必要に応じて、画像が保存されるフォルダーパス、DPI (インチあたりのドット数)、画質、生成されたファイル名を保存するオプションのリストを指定します。

画像を保存する必要があるフォルダーパスを指定して、このメソッドを呼び出します。必要に応じて、DPI と画質のパラメーターを調整します。[FileNames] パラメーターとしてリストを指定すると、生成された画像ファイルの名前が入力されます。

表 : 4. ConvertToImages メソッドのパラメーター
パラメーター	説明	データタイプ
Folderpath	変換された画像が保存されるフォルダーパス。フォルダーが存在し、適切な書き込み権限があることを確認します。	文字列
Dpi	生成された画像の DPI (インチあたりドット数) 解像度。既定値は 200 DPI です。	Int32
品質	範囲が 0 (最低) から 100 (最高) の生成された画像の品質レベル。デフォルトは 95 です。	Int32

ConvertToWord

PDF を Microsoft Word ドキュメントに変換します。

変換された Word ドキュメントを保存する必要があるファイルパスを指定して、このメソッドを呼び出します。このメソッドは、指定されたパスの PDF コンテンツから Word ドキュメントを作成します。

表 : 5. ConvertToWord メソッドのパラメーター
パラメーター	説明	データタイプ
WordFilepath	変換された Word ドキュメント (.doc) が保存されるファイルパス。ファイルパスにファイル名と拡張子が含まれていることを確認します。	文字列

ConvertToXml

PDF ドキュメントの指定されたページを Microsoft XML 形式に変換します。オプションで、指定した場合はテーブルのみを変換できます。

変換する PDF のページ番号、XML 出力を保存する必要があるファイルパスを指定してこのメソッドを呼び出し、テーブルのみを変換する必要がある場合はオプションで ConvertTablesOnly を True に設定します。

表 : 6. ConvertToXml メソッドのパラメーター
パラメーター	説明	データタイプ
PageNumber	XML 形式に変換される PDF のページ番号。通常、ページ番号は 1 から始まります。	Int32
XmlFilePath	変換された XML ドキュメントが保存されるファイルパス。ファイルパスにファイル名と拡張子が含まれていることを確認します。	文字列
ConvertTablesOnly	True に設定すると、指定したページのテーブルのみが XML に変換されます。デフォルトは [True] です。	ブーリアン

ExtractImages

PDF ドキュメントの指定されたページから画像を抽出します。必要に応じて、画像が保存されるフォルダーパスと、生成されたファイル名を保存する出力リストを指定します。

画像を保存する必要があるフォルダーパス、画像を抽出する開始ページ番号と終了ページ番号、抽出した画像のファイル名を格納する空のリストを指定して、このメソッドを呼び出します。

表 : 7. ExtractImages メソッドのパラメーター
パラメーター	説明	データタイプ
Folderpath	抽出された画像が保存されるフォルダーパス。フォルダーが存在し、適切な書き込み権限があることを確認します。	文字列
FromPage	画像を抽出する開始ページ番号。通常、ページ番号は 1 から始まります。	Int32
ToPage	画像を抽出する終了ページ番号。この数値は、[FromPage] の数値以上でなければなりません。	Int32
FileNames	抽出された画像のファイル名を格納する出力パラメーター。	List1

GetAllTables

PDF ドキュメントからすべてのテーブルを抽出し、DataTable のリストとして返します。

[Return] パラメーターを使用して、抽出されたテーブルデータをリストとして取得します。

パラメーターを指定せずにこのメソッドを呼び出して、PDF ドキュメントからすべてのテーブルを取得します。このメソッドは DataTable のリストを返します。各 DataTable は PDF から抽出されたテーブルを表します。

表 : 8. GetAllTables メソッドのパラメーター
パラメーター	説明	データタイプ
Return	このメソッドは、PDF ファイルから抽出されたテーブルを表す DataTable のリストを返します。	List1

GetPageAsImage

PDF ドキュメントページからデータを抽出し、インメモリ画像として保存します。

PDF ドキュメントの指定されたページをインメモリ画像として返します。

PDF のページ番号を指定してこのメソッドを呼び出し、ページを画像として取得します。このメソッドは、ページを System.Drawing.Image オブジェクトとして返します。

表 : 9. GetPageAsImage メソッドのパラメーター
パラメーター	説明	データタイプ
PageNumber	画像に変換される PDF のページ番号。通常、ページ番号は 1 から始まります。	Int32
Return	このメソッドは、PDF ファイルの指定されたページを表す画像を返します。	Drawing.Image

GetPageCount

PDF ドキュメントの総ページ数を取得します。PDF の総ページ数を整数として取得するために、[Return] パラメーターを使用する必要があります。

表 : 10. GetPageCount メソッドのパラメーター
パラメーター	説明	データタイプ
Return	このメソッドは、PDF ファイルのページ数を表す整数を返します。	Int32

GetTable

PDF からテーブルを抽出し、DataTable として返します。抽出メソッドは ExtractBy パラメーターで指定します。

抽出タイプと対応する値を使用して、このメソッドを呼び出します。このメソッドは、抽出されたテーブルを DataTable として返します。

表 : 11. GetTable メソッドのパラメーター
パラメーター	説明	データタイプ
ExtractBy	使用する抽出メソッド。このパラメーターは ExtractType である必要があり、次のオプションが含まれます。Index (0) - ページ番号で抽出、ContainsText (1) - 一致するテキストで抽出。	ExtractType
値	抽出タイプに対応する値。たとえば、ExtractBy が Index の場合、これは文字列としてのページ番号になります。ExtractBy が ContainsText の場合、これは一致するテキストになります。	文字列
Return	このメソッドは、PDF ファイルから抽出されたテーブルを表す DataTable を返します。	テーブル

GetText

指定された範囲の PDF ページからテキストを取得します。

開始ページ番号と終了ページ番号を指定してこのメソッドを呼び出し、それらのページからテキストを取得します。このメソッドは、抽出されたテキストを文字列として返します。

表 : 12. GetText メソッドのパラメーター
パラメーター	説明	データタイプ
FromPage	テキストを抽出する範囲の開始ページ番号。通常、ページ番号は 1 から始まります。	Int32
ToPage	開始ページからどのページまでテキストを取得するかを入力します。注: ToPage 値が [FromPage] の値よりも大きいことを確認します。	Int32
Return	このメソッドは、PDF ファイルのテキストコンテンツを表す文字列を返します。	文字列

Load

インタラクションのために PDF ファイルをロードし、コンテンツの抽出などの追加の操作を有効にします。

PDF ファイルへのフルパス (FilePath) を指定してこのメソッドを呼び出し、PDF が保護されている場合はオプションでパスワード (Password) を指定します。

表 : 13. Load メソッドのパラメーター
パラメーター	説明	データタイプ
FilePath	ロードする PDF ファイルへのフルパス。ファイル名と拡張子を含める必要があります。	文字列
パスワード	PDF ファイルが保護されている場合のパスワード。PDF がパスワードで保護されていない場合、このパラメーターは空の文字列にすることができます。	文字列

Merge

複数の PDF ファイルのリストを 1 つの PDF ファイルに結合します。

結合する PDF のファイルパスのリスト、出力ファイルパス、オプションの上書きフラグを指定して、このメソッドを呼び出します。

表 : 14. Merge メソッドのパラメーター
パラメーター	説明	データタイプ
FileList	結合する PDF ファイルのファイルパスのリスト。各パスは、PDF ファイルへの有効なパスである必要があります。	ArrayList
OutputFilePath	結合された PDF が保存されるファイルパス。ファイル名と拡張子を含める必要があります。	文字列
Overwrite	[True] に設定すると、出力パスに既存のファイルが存在する場合は上書きされます。[False] に設定すると、メソッドは既存のファイルを上書きしません。デフォルトは [False] です。	Boolean

注:

PDF ファイルがパスワードで保護されている場合、または [FileList] パラメーターの形式が間違っている場合、自動化によってエラーが表示されます。

Split

1 つの PDF を複数のファイルに分割し、PDF の各ページを個別のファイルとして保存します。

分割された PDF ページを保存する必要がある出力フォルダーパスを指定して、このメソッドを呼び出します。

表 : 15. Split メソッドのパラメーター
パラメーター	説明	データタイプ
OutputFolderPath	分割された PDF ページが保存されるフォルダーへのパスです。フォルダーが存在するか、ファイルを書き込むための適切な権限があることを確認します。	文字列