PDF コネクタのメソッド
RPA デスクトップデザインスタジオ での PDF コネクタのさまざまなメソッドを使用することで、ドキュメント自動化の PDF 処理を高速化します。
PDF コネクタを使用するための前提条件
他のメソッドを使用する前に、PDF コネクタの Load メソッドを使用してください。PDF ファイルへのフルパス (FilePath) を指定してこのメソッドを呼び出し、PDF が保護されている場合はオプションでパスワード (Password) を指定します。
閉じる
PDF ドキュメントに関連付けられているリソースを閉じます。Load メソッドを使用した後に参照とリソースを解放するには、このメソッドを使用します。
このメソッドは、PDF ドキュメントを使用する必要がなくなった場合、または操作が完了した後に呼び出します。
ConvertToExcel
PDF ドキュメントを Microsoft Excel ドキュメントに変換します。オプションで、指定した場合はテーブルのみを変換できます。
変換された Excel ドキュメントを保存する必要があるファイルパスを指定してこのメソッドを呼び出し、テーブルのみを変換する必要がある場合は、オプションで [ConvertTablesOnly] を [True] に設定します。
| パラメーター | 説明 | データタイプ |
|---|---|---|
| ExcelFilePath | 変換された Excel ドキュメント (.xlsx) が保存されるファイルパス。ファイルパスにファイル名と拡張子が含まれていることを確認します。 | 文字列 |
| ConvertTablesOnly | [True] に設定すると、PDF ドキュメントのテーブルのみが Excel に変換されます。デフォルトは [True] です。 | ブーリアン |
ConvertToHTML
PDF の指定されたページを HTML 形式に変換します。ページ番号が 0 以下の場合、PDF のすべてのページが HTML に変換されます。
HTML に変換する PDF のページ番号を指定して、このメソッドを呼び出します。0 以下のページ番号を渡すと、PDF 全体が HTML に変換されます。このメソッドは、HTML コンテンツを文字列として返します。
| パラメーター | 説明 | データタイプ |
|---|---|---|
| PageNumber (データ入力) | HTML に変換される PDF のページ番号。このパラメーターが 0 以下の場合、PDF のすべてのページが HTML に変換されます。通常、ページ番号は 1 から始まります。 | Int32 |
| Return (データ出力) | このメソッドは、PDF ファイルのコンテンツを表す文字列として HTML コンテンツを返します。 | 文字列 |
ConvertToImage
PDF ドキュメントの指定されたページを画像に変換します。必要に応じて、画像が保存される画像のパス、DPI (インチあたりのドット数)、および画質を指定します。
変換する PDF のページ番号、画像を保存する必要があるファイルパスを指定してこのメソッドを呼び出し、オプションで DPI と画質のパラメーターを調整します。
| パラメーター | 説明 | データタイプ |
|---|---|---|
| PageNumber | 画像に変換される PDF のページ番号。通常、ページ番号は 1 から始まります。 | Int32 |
| ImagePath | 変換された画像が保存されるファイルパス。ファイルパスにファイル名と拡張子が含まれていることを確認します。 | 文字列 |
| Dpi | 生成された画像の DPI (インチあたりのドット数) 解像度。既定値は 200 DPI です。 | Int32 |
| 品質 | 範囲が 0 (最低) から 100 (最高) の生成された画像の品質レベル。デフォルトは 95 です。 | Int32 |
ConvertToImages
PDF ドキュメントを画像に変換します。必要に応じて、画像が保存されるフォルダーパス、DPI (インチあたりのドット数)、画質、生成されたファイル名を保存するオプションのリストを指定します。
画像を保存する必要があるフォルダーパスを指定して、このメソッドを呼び出します。必要に応じて、DPI と画質のパラメーターを調整します。[FileNames] パラメーターとしてリストを指定すると、生成された画像ファイルの名前が入力されます。
| パラメーター | 説明 | データタイプ |
|---|---|---|
| Folderpath | 変換された画像が保存されるフォルダーパス。フォルダーが存在し、適切な書き込み権限があることを確認します。 例: /Users/Username/Documents/MyFolder |
文字列 |
| Dpi | 生成された画像の DPI (インチあたりドット数) 解像度。既定値は 200 DPI です。 | Int32 |
| 品質 | 範囲が 0 (最低) から 100 (最高) の生成された画像の品質レベル。デフォルトは 95 です。 | Int32 |
ConvertToWord
PDF を Microsoft Word ドキュメントに変換します。
変換された Word ドキュメントを保存する必要があるファイルパスを指定して、このメソッドを呼び出します。このメソッドは、指定されたパスの PDF コンテンツから Word ドキュメントを作成します。
| パラメーター | 説明 | データタイプ |
|---|---|---|
| WordFilepath | 変換された Word ドキュメント (.doc) が保存されるファイルパス。ファイルパスにファイル名と拡張子が含まれていることを確認します。 | 文字列 |
ConvertToXml
PDF ドキュメントの指定されたページを Microsoft XML 形式に変換します。オプションで、指定した場合はテーブルのみを変換できます。
変換する PDF のページ番号、XML 出力を保存する必要があるファイルパスを指定してこのメソッドを呼び出し、テーブルのみを変換する必要がある場合はオプションで ConvertTablesOnly を True に設定します。
| パラメーター | 説明 | データタイプ |
|---|---|---|
| PageNumber | XML 形式に変換される PDF のページ番号。通常、ページ番号は 1 から始まります。 | Int32 |
| XmlFilePath | 変換された XML ドキュメントが保存されるファイルパス。ファイルパスにファイル名と拡張子が含まれていることを確認します。 | 文字列 |
| ConvertTablesOnly | True に設定すると、指定したページのテーブルのみが XML に変換されます。デフォルトは [True] です。 | ブーリアン |
ExtractImages
PDF ドキュメントの指定されたページから画像を抽出します。必要に応じて、画像が保存されるフォルダーパスと、生成されたファイル名を保存する出力リストを指定します。
画像を保存する必要があるフォルダーパス、画像を抽出する開始ページ番号と終了ページ番号、抽出した画像のファイル名を格納する空のリストを指定して、このメソッドを呼び出します。
| パラメーター | 説明 | データタイプ |
|---|---|---|
| Folderpath | 抽出された画像が保存されるフォルダーパス。フォルダーが存在し、適切な書き込み権限があることを確認します。 | 文字列 |
| FromPage | 画像を抽出する開始ページ番号。通常、ページ番号は 1 から始まります。 | Int32 |
| ToPage | 画像を抽出する終了ページ番号。この数値は、[FromPage] の数値以上でなければなりません。 | Int32 |
| FileNames | 抽出された画像のファイル名を格納する出力パラメーター。 | List1 |
GetAllTables
PDF ドキュメントからすべてのテーブルを抽出し、DataTable のリストとして返します。
[Return] パラメーターを使用して、抽出されたテーブルデータをリストとして取得します。
パラメーターを指定せずにこのメソッドを呼び出して、PDF ドキュメントからすべてのテーブルを取得します。このメソッドは DataTable のリストを返します。各 DataTable は PDF から抽出されたテーブルを表します。
| パラメーター | 説明 | データタイプ |
|---|---|---|
| Return | このメソッドは、PDF ファイルから抽出されたテーブルを表す DataTable のリストを返します。 | List1 |
GetPageAsImage
PDF ドキュメントページからデータを抽出し、インメモリ画像として保存します。
PDF ドキュメントの指定されたページをインメモリ画像として返します。
PDF のページ番号を指定してこのメソッドを呼び出し、ページを画像として取得します。このメソッドは、ページを System.Drawing.Image オブジェクトとして返します。
| パラメーター | 説明 | データタイプ |
|---|---|---|
| PageNumber | 画像に変換される PDF のページ番号。通常、ページ番号は 1 から始まります。 | Int32 |
| Return | このメソッドは、PDF ファイルの指定されたページを表す画像を返します。 | Drawing.Image |
GetPageCount
PDF ドキュメントの総ページ数を取得します。PDF の総ページ数を整数として取得するために、[Return] パラメーターを使用する必要があります。
| パラメーター | 説明 | データタイプ |
|---|---|---|
| Return | このメソッドは、PDF ファイルのページ数を表す整数を返します。 | Int32 |
GetTable
PDF からテーブルを抽出し、DataTable として返します。抽出メソッドは ExtractBy パラメーターで指定します。
抽出タイプと対応する値を使用して、このメソッドを呼び出します。このメソッドは、抽出されたテーブルを DataTable として返します。
| パラメーター | 説明 | データタイプ |
|---|---|---|
| ExtractBy | 使用する抽出メソッド。 このパラメーターは ExtractType である必要があり、次のオプションが含まれます。Index (0) - ページ番号で抽出、ContainsText (1) - 一致するテキストで抽出。 |
ExtractType |
| 値 | 抽出タイプに対応する値。 たとえば、ExtractBy が Index の場合、これは文字列としてのページ番号になります。ExtractBy が ContainsText の場合、これは一致するテキストになります。 |
文字列 |
| Return | このメソッドは、PDF ファイルから抽出されたテーブルを表す DataTable を返します。 | テーブル |
GetText
指定された範囲の PDF ページからテキストを取得します。
開始ページ番号と終了ページ番号を指定してこのメソッドを呼び出し、それらのページからテキストを取得します。このメソッドは、抽出されたテキストを文字列として返します。
| パラメーター | 説明 | データタイプ |
|---|---|---|
| FromPage | テキストを抽出する範囲の開始ページ番号。通常、ページ番号は 1 から始まります。 | Int32 |
| ToPage | 開始ページからどのページまでテキストを取得するかを入力します。 注: ToPage 値が [FromPage] の値よりも大きいことを確認します。 |
Int32 |
| Return | このメソッドは、PDF ファイルのテキストコンテンツを表す文字列を返します。 | 文字列 |
Load
インタラクションのために PDF ファイルをロードし、コンテンツの抽出などの追加の操作を有効にします。
PDF ファイルへのフルパス (FilePath) を指定してこのメソッドを呼び出し、PDF が保護されている場合はオプションでパスワード (Password) を指定します。
| パラメーター | 説明 | データタイプ |
|---|---|---|
| FilePath | ロードする PDF ファイルへのフルパス。ファイル名と拡張子を含める必要があります。 | 文字列 |
| パスワード | PDF ファイルが保護されている場合のパスワード。PDF がパスワードで保護されていない場合、このパラメーターは空の文字列にすることができます。 | 文字列 |
Merge
複数の PDF ファイルのリストを 1 つの PDF ファイルに結合します。
結合する PDF のファイルパスのリスト、出力ファイルパス、オプションの上書きフラグを指定して、このメソッドを呼び出します。
| パラメーター | 説明 | データタイプ |
|---|---|---|
| FileList | 結合する PDF ファイルのファイルパスのリスト。各パスは、PDF ファイルへの有効なパスである必要があります。 | ArrayList |
| OutputFilePath | 結合された PDF が保存されるファイルパス。ファイル名と拡張子を含める必要があります。 | 文字列 |
| Overwrite | [True] に設定すると、出力パスに既存のファイルが存在する場合は上書きされます。[False] に設定すると、メソッドは既存のファイルを上書きしません。 デフォルトは [False] です。 |
Boolean |
Split
1 つの PDF を複数のファイルに分割し、PDF の各ページを個別のファイルとして保存します。
分割された PDF ページを保存する必要がある出力フォルダーパスを指定して、このメソッドを呼び出します。
| パラメーター | 説明 | データタイプ |
|---|---|---|
| OutputFolderPath | 分割された PDF ページが保存されるフォルダーへのパスです。フォルダーが存在するか、ファイルを書き込むための適切な権限があることを確認します。 | 文字列 |