PDF-Connector-Methoden
- Aktualisiert31. Juli 2025
- 7 Minuten Lesedauer
- Zurich
- "RPA-Hub"
Beschleunigen Sie die PDF-Verarbeitung für die Dokumentautomatisierung, indem Sie die verschiedenen Methoden des PDF-Connectors in verwenden RPA Desktop Design Studio.
Voraussetzungen für die Verwendung des PDF-Connectors
Verwenden Sie die Methode Laden im PDF-Connector, bevor Sie die anderen Methoden verwenden. Rufen Sie diese Methode mit dem vollständigen Pfad zur PDF-Datei (Dateipfad) auf, und geben Sie optional ein Passwort (Passwort) an, wenn die PDF-Datei geschützt ist.
Schließen
Schließt die dem PDF-Dokument zugeordneten Ressourcen. Verwenden Sie diese Methode, um alle Referenzen und Ressourcen nach Verwendung der Methode Laden freizugeben.
Rufen Sie diese Methode auf, wenn Sie das PDF-Dokument nicht mehr verwenden müssen oder nachdem Sie Vorgänge damit abgeschlossen haben.
In Excel konvertieren
Konvertiert ein PDF-Dokument in ein Microsoft Excel-Dokument. Optional können nur Tabellen konvertiert werden, wenn angegeben.
Rufen Sie diese Methode mit dem Dateipfad auf, in dem das konvertierte Excel-Dokument gespeichert werden muss, und optional festgelegt TablesOnly konvertieren Bis Wahr Wenn nur Tabellen konvertiert werden müssen.
| Parameter | Beschreibung | Datentyp |
|---|---|---|
| ExcelFilepath | Der Dateipfad, in dem das konvertierte Excel-Dokument (.xlsx) gespeichert wird. Stellen Sie sicher, dass der Dateipfad den Dateinamen und die Erweiterung enthält. | Zeichenfolge |
| TablesOnly konvertieren | Wenn auf festgelegt Wahr , Nur Tabellen aus dem PDF-Dokument werden in Excel konvertiert. Der Standardwert ist Wahr . | Boolean |
In HTML konvertieren
Konvertiert eine angegebene Seite einer PDF-Datei in das HTML-Format. Wenn die Seitenzahl kleiner oder gleich 0 ist, werden alle Seiten der PDF-Datei in HTML konvertiert.
Rufen Sie diese Methode mit der Seitennummer der PDF-Datei auf, die Sie in HTML konvertieren möchten. Wenn Sie eine Seitenzahl kleiner oder gleich 0 übergeben, wird die gesamte PDF-Datei in HTML konvertiert. Die Methode gibt den HTML-Inhalt als Zeichenfolge zurück.
| Parameter | Beschreibung | Datentyp |
|---|---|---|
| Pagenumber (Daten in) | Die Seitenzahl der PDF-Datei, die in HTML konvertiert werden soll. Wenn dieser Parameter kleiner oder gleich 0 ist, werden alle Seiten der PDF-Datei in HTML konvertiert. Seitenzahlen beginnen normalerweise mit 1. | Int32 |
| Zurückgeben (Datenausgang) | Diese Methode gibt den HTML-Inhalt als Zeichenfolge zurück, die den Inhalt der PDF-Datei darstellt. | Zeichenfolge |
ConvertToImage
Konvertiert eine angegebene Seite eines PDF-Dokuments in ein Bild. Geben Sie optional den Bildpfad an, in dem das Bild gespeichert wird, DPI (Punkte pro Zoll) und die Bildqualität.
Rufen Sie diese Methode mit der Seitennummer der zu konvertierenden PDF-Datei und dem Dateipfad auf, in dem das Bild gespeichert werden muss, und passen Sie optional die DPI- und Bildqualitätsparameter an.
| Parameter | Beschreibung | Datentyp |
|---|---|---|
| Pagennummeriert | Die Seitenzahl der PDF-Datei, die in ein Bild konvertiert werden soll. Seitenzahlen beginnen normalerweise mit 1. | Int32 |
| ImagePath | Der Dateipfad, in dem das konvertierte Bild gespeichert wird. Stellen Sie sicher, dass der Dateipfad den Dateinamen und die Erweiterung enthält | Zeichenfolge |
| Dpi | Die DPI-Auflösung (Punkte pro Zoll) für das generierte Bild. Der Standardwert ist 200 DPI. | Int32 |
| Qualität | Das Qualitätsniveau des generierten Bildes, von 0 (niedrigste) bis 100 (höchste). Der Standardwert ist 95. | Int32 |
Konvertiertzu Images
Konvertiert ein PDF-Dokument in Bilder. Geben Sie optional den Ordnerpfad an, in dem die Bilder gespeichert werden, DPI (Punkte pro Zoll), Bildqualität und eine optionale Liste zum Speichern der generierten Dateinamen.
Rufen Sie diese Methode mit dem Ordnerpfad auf, in dem die Bilder gespeichert werden müssen. Passen Sie optional die DPI- und Bildqualitätsparameter an. Wenn Sie eine Liste als angeben Dateinamen Parameter, wird mit den Namen der generierten Bilddateien ausgefüllt.
| Parameter | Beschreibung | Datentyp |
|---|---|---|
| Ordnerpfad | Der Ordnerpfad, in dem die konvertierten Bilder gespeichert werden. Stellen Sie sicher, dass der Ordner vorhanden ist und über entsprechende Schreibberechtigungen verfügt. Beispiel: /Anwender/Anwendername/Dokumente/mein Ordner |
Zeichenfolge |
| Dpi | Die DPI-Auflösung (Punkte pro Zoll) für die generierten Bilder. Der Standardwert ist 200 DPI. | Int32 |
| Qualität | Das Qualitätsniveau der generierten Bilder, von 0 (am niedrigsten) bis 100 (am höchsten). Der Standardwert ist 95. | Int32 |
ConvertToWord
Konvertiert eine PDF-Datei in eine Microsoft Word-Dokument.
Rufen Sie diese Methode mit dem Dateipfad auf, in dem das konvertierte Word-Dokument gespeichert werden muss. Die Methode erstellt ein Word-Dokument aus dem PDF-Inhalt im angegebenen Pfad.
| Parameter | Beschreibung | Datentyp |
|---|---|---|
| WordFilepath | Der Dateipfad, in dem das konvertierte Word-Dokument (.doc) gespeichert wird. Stellen Sie sicher, dass der Dateipfad den Dateinamen und die Erweiterung enthält. | Zeichenfolge |
Konvertieren in Xml
Konvertiert eine angegebene Seite eines PDF-Dokuments in das Microsoft XML-Format. Optional können nur Tabellen konvertiert werden, wenn angegeben.
Rufen Sie diese Methode mit der Seitennummer der zu konvertierenden PDF-Datei, dem Dateipfad, in dem die XML-Ausgabe gespeichert werden muss, und optional festgelegt auf TablesOnly konvertieren Bis Wahr Wenn nur Tabellen konvertiert werden müssen.
| Parameter | Beschreibung | Datentyp |
|---|---|---|
| Pagennummeriert | Die Seitenzahl der PDF-Datei, die in das XML-Format konvertiert werden soll. Seitenzahlen beginnen normalerweise mit 1. | Int32 |
| XmlFilePath | Der Dateipfad, in dem das konvertierte XML-Dokument gespeichert wird. Stellen Sie sicher, dass der Dateipfad den Dateinamen und die Erweiterung enthält | Zeichenfolge |
| TablesOnly konvertieren | Bei „wahr“ werden nur Tabellen von der angegebenen Seite in XML konvertiert. Der Standardwert ist „wahr“. | Boolean |
ExtractImages
Extrahiert Bilder von angegebenen Seiten eines PDF-Dokuments. Geben Sie optional den Ordnerpfad an, in dem die Bilder gespeichert werden, und eine Ausgabeliste zum Speichern der generierten Dateinamen.
Rufen Sie diese Methode mit dem Ordnerpfad auf, in dem die Bilder gespeichert werden müssen, den Nummern der Start- und Endseite, aus der Bilder extrahiert werden sollen, und einer leeren Liste zum Speichern der Dateinamen der extrahierten Bilder.
| Parameter | Beschreibung | Datentyp |
|---|---|---|
| Ordnerpfad | Der Ordnerpfad, in dem die extrahierten Bilder gespeichert werden. Stellen Sie sicher, dass der Ordner vorhanden ist und über entsprechende Schreibberechtigungen verfügt. | Zeichenfolge |
| Von Seite | Die Nummer der Startseite, von der Bilder extrahiert werden sollen. Seitenzahlen beginnen normalerweise mit 1. | Int32 |
| ToPage | Die Endseitenzahl, bis zu der Bilder extrahiert werden müssen. Diese Zahl muss größer oder gleich sein Von Seite Nummer. | Int32 |
| Dateinamen | Ein Ausgabeparameter, der die Dateinamen der extrahierten Bilder speichert. | Liste`1 |
GetAllTables
Extrahiert alle Tabellen aus einem PDF-Dokument und gibt sie als Liste von Datentabellen zurück.
Verwenden Sie Zurück Parameter zum Abrufen der extrahierten Tabellendaten als Liste.
Rufen Sie diese Methode ohne Parameter auf, um alle Tabellen aus dem PDF-Dokument abzurufen. Die Methode gibt eine Liste von Datentabellen zurück, wobei jede DataTable eine aus der PDF extrahierte Tabelle darstellt.
| Parameter | Beschreibung | Datentyp |
|---|---|---|
| Zurück | Diese Methode gibt eine Liste von DataTable zurück, die eine aus der PDF-Datei extrahierte Tabelle darstellt. | Liste`1 |
GetPageAsImage
Extrahiert Daten aus einer PDF-Dokumentseite und speichert sie als in-Memory-Bild.
Gibt eine angegebene Seite eines PDF-Dokuments als speicherinternes Bild zurück.
Rufen Sie diese Methode mit der Seitennummer der PDF-Datei auf, um die Seite als Bild abzurufen. Die Methode gibt die Seite als System.drawing.Image-Objekt zurück.
| Parameter | Beschreibung | Datentyp |
|---|---|---|
| Pagennummeriert | Die Seitenzahl der PDF-Datei, die in ein Bild konvertiert werden soll. Seitenzahlen beginnen normalerweise mit 1. | Int32 |
| Zurück | Diese Methode gibt ein Bild zurück, das eine angegebene Seite der PDF-Datei darstellt. | Zeichnung.Bild |
GetPageCount
Ruft die Gesamtzahl der Seiten in einem PDF-Dokument ab. Sie müssen verwenden Zurück Parameter zum Abrufen der Gesamtseitenzahl in der PDF-Datei als Ganzzahl.
| Parameter | Beschreibung | Datentyp |
|---|---|---|
| Zurück | Diese Methode gibt eine Ganzzahl zurück, die die Anzahl der Seiten der PDF-Datei darstellt. | Int32 |
Gettable
Extrahiert eine Tabelle aus einer PDF-Datei und gibt sie als Datentabelle zurück. Die Extraktionsmethode wird von angegeben Extrahieren nach Parameter.
Rufen Sie diese Methode mit dem Extraktionstyp und dem entsprechenden Wert auf. Die Methode gibt die extrahierte Tabelle als DataTable zurück.
| Parameter | Beschreibung | Datentyp |
|---|---|---|
| Extrahieren nach | Die zu verwendende Extraktionsmethode. Dieser Parameter muss „ExtractType“ sein, der die folgenden Optionen enthält: Index (0) – Extrahieren nach Seitenzahl und ContainsText (1) – Extrahieren nach übereinstimmendem Text. |
Extrakttyp |
| Wert | Der Wert, der dem Extraktionstyp entspricht. Beispiel: Wenn Extrahieren nach Ist Index, dies wäre die Seitenzahl als Zeichenfolge; wenn Extrahieren nach Ist ContainsText, dies wäre der abzugleichende Text. |
Zeichenfolge |
| Zurück | Diese Methode gibt eine DataTable zurück, die eine aus der PDF-Datei extrahierte Tabelle darstellt. | Tabelle |
Gettext
Ruft Text aus dem angegebenen Bereich von PDF-Seiten ab.
Rufen Sie diese Methode mit den Nummern der Start- und Endseite auf, um Text von diesen Seiten abzurufen. Die Methode gibt den extrahierten Text als Zeichenfolge zurück.
| Parameter | Beschreibung | Datentyp |
|---|---|---|
| Von Seite | Die Nummer der Startseite des Bereichs, aus dem Text extrahiert werden soll. Seitenzahlen beginnen normalerweise mit 1. | Int32 |
| ToPage | Die Seitenzahl, zu der Sie Text von der Startseite abrufen. Hinweis: Stellen Sie sicher, dass der ToPage-Wert höher ist als Von Seite Wert. |
Int32 |
| Zurück | Diese Methode gibt eine Zeichenfolge zurück, die den Textinhalt der PDF-Datei darstellt. | Zeichenfolge |
Laden
Lädt eine PDF-Datei für die Interaktion, um weitere Vorgänge wie das Extrahieren von Inhalten zu ermöglichen.
Rufen Sie diese Methode mit dem vollständigen Pfad zur PDF-Datei (Dateipfad) auf, und geben Sie optional ein Passwort (Passwort) an, wenn die PDF-Datei geschützt ist.
| Parameter | Beschreibung | Datentyp |
|---|---|---|
| FilePath | Der vollständige Pfad zur PDF-Datei, die geladen werden soll. Dies muss den Dateinamen und die Erweiterung enthalten. | Zeichenfolge |
| Passwort | Das Passwort für die PDF-Datei, falls sie geschützt ist. Wenn die PDF-Datei nicht passwortgeschützt ist, kann dieser Parameter eine leere Zeichenfolge sein. | Zeichenfolge |
Zusammenfügung
Führt eine Liste von PDF-Dateien in einer einzelnen PDF-Datei zusammen.
Rufen Sie diese Methode mit einer Liste der Dateipfade der zusammenzuführenden PDFs, dem Ausgabedateipfad und einer optionalen Überschreibkennzeichnung auf.
| Parameter | Beschreibung | Datentyp |
|---|---|---|
| Dateiliste | Eine Liste von Dateipfaden für die zusammenzuführenden PDF-Dateien. Jeder Pfad muss ein gültiger Pfad zu einer PDF-Datei sein. | ArrayList |
| Ausgabedateipfad | Der Dateipfad, in dem die zusammengeführte PDF gespeichert wird. Dies muss den Dateinamen und die Erweiterung enthalten. | Zeichenfolge |
| Überschreiben | Wenn auf festgelegt Wahr , Die Methode überschreibt die vorhandene Datei im Ausgabepfad, falls vorhanden. Wenn auf festgelegt Falsch , Die Methode überschreibt die vorhandene Datei nicht. Der Standardwert ist Falsch . |
Boolean |
Teilen
Teilt eine einzelne PDF-Datei in mehrere Dateien auf, wobei jede Seite in der PDF-Datei als separate Datei gespeichert wird.
Rufen Sie diese Methode mit dem Ausgabeordnerpfad auf, in dem die geteilten PDF-Seiten gespeichert werden müssen.
| Parameter | Beschreibung | Datentyp |
|---|---|---|
| OutputFolderPath | Der Pfad zu dem Ordner, in dem die geteilten PDF-Seiten gespeichert werden. Stellen Sie sicher, dass der Ordner vorhanden ist oder über entsprechende Berechtigungen zum Schreiben von Dateien verfügt. | Zeichenfolge |