Beschleunigen Sie die PDF-Verarbeitung für die Dokumentautomatisierung, indem Sie die verschiedenen Methoden des PDF-Connectors in verwenden RPA Desktop Design Studio.

Voraussetzungen für die Verwendung des PDF-Connectors

Verwenden Sie die Methode Laden im PDF-Connector, bevor Sie die anderen Methoden verwenden. Rufen Sie diese Methode mit dem vollständigen Pfad zur PDF-Datei (Dateipfad) auf, und geben Sie optional ein Passwort (Passwort) an, wenn die PDF-Datei geschützt ist.

Schließen

Schließt die dem PDF-Dokument zugeordneten Ressourcen. Verwenden Sie diese Methode, um alle Referenzen und Ressourcen nach Verwendung der Methode Laden freizugeben.

Rufen Sie diese Methode auf, wenn Sie das PDF-Dokument nicht mehr verwenden müssen oder nachdem Sie Vorgänge damit abgeschlossen haben.

In Excel konvertieren

Konvertiert ein PDF-Dokument in ein Microsoft Excel-Dokument. Optional können nur Tabellen konvertiert werden, wenn angegeben.

Rufen Sie diese Methode mit dem Dateipfad auf, in dem das konvertierte Excel-Dokument gespeichert werden muss, und optional festgelegt TablesOnly konvertieren Bis Wahr Wenn nur Tabellen konvertiert werden müssen.

Tabelle : 1. Parameter der ConvertToExcel-Methode
Parameter Beschreibung Datentyp
ExcelFilepath Der Dateipfad, in dem das konvertierte Excel-Dokument (.xlsx) gespeichert wird. Stellen Sie sicher, dass der Dateipfad den Dateinamen und die Erweiterung enthält. Zeichenfolge
TablesOnly konvertieren Wenn auf festgelegt Wahr , Nur Tabellen aus dem PDF-Dokument werden in Excel konvertiert. Der Standardwert ist Wahr . Boolean

In HTML konvertieren

Konvertiert eine angegebene Seite einer PDF-Datei in das HTML-Format. Wenn die Seitenzahl kleiner oder gleich 0 ist, werden alle Seiten der PDF-Datei in HTML konvertiert.

Rufen Sie diese Methode mit der Seitennummer der PDF-Datei auf, die Sie in HTML konvertieren möchten. Wenn Sie eine Seitenzahl kleiner oder gleich 0 übergeben, wird die gesamte PDF-Datei in HTML konvertiert. Die Methode gibt den HTML-Inhalt als Zeichenfolge zurück.

Tabelle : 2. Parameter der ConvertToHTML-Methode
Parameter Beschreibung Datentyp
Pagenumber (Daten in) Die Seitenzahl der PDF-Datei, die in HTML konvertiert werden soll. Wenn dieser Parameter kleiner oder gleich 0 ist, werden alle Seiten der PDF-Datei in HTML konvertiert. Seitenzahlen beginnen normalerweise mit 1. Int32
Zurückgeben (Datenausgang) Diese Methode gibt den HTML-Inhalt als Zeichenfolge zurück, die den Inhalt der PDF-Datei darstellt. Zeichenfolge

ConvertToImage

Konvertiert eine angegebene Seite eines PDF-Dokuments in ein Bild. Geben Sie optional den Bildpfad an, in dem das Bild gespeichert wird, DPI (Punkte pro Zoll) und die Bildqualität.

Rufen Sie diese Methode mit der Seitennummer der zu konvertierenden PDF-Datei und dem Dateipfad auf, in dem das Bild gespeichert werden muss, und passen Sie optional die DPI- und Bildqualitätsparameter an.

Tabelle : 3. Parameter der ConvertToImage-Methode
Parameter Beschreibung Datentyp
Pagennummeriert Die Seitenzahl der PDF-Datei, die in ein Bild konvertiert werden soll. Seitenzahlen beginnen normalerweise mit 1. Int32
ImagePath Der Dateipfad, in dem das konvertierte Bild gespeichert wird. Stellen Sie sicher, dass der Dateipfad den Dateinamen und die Erweiterung enthält Zeichenfolge
Dpi Die DPI-Auflösung (Punkte pro Zoll) für das generierte Bild. Der Standardwert ist 200 DPI. Int32
Qualität Das Qualitätsniveau des generierten Bildes, von 0 (niedrigste) bis 100 (höchste). Der Standardwert ist 95. Int32

Konvertiertzu Images

Konvertiert ein PDF-Dokument in Bilder. Geben Sie optional den Ordnerpfad an, in dem die Bilder gespeichert werden, DPI (Punkte pro Zoll), Bildqualität und eine optionale Liste zum Speichern der generierten Dateinamen.

Rufen Sie diese Methode mit dem Ordnerpfad auf, in dem die Bilder gespeichert werden müssen. Passen Sie optional die DPI- und Bildqualitätsparameter an. Wenn Sie eine Liste als angeben Dateinamen Parameter, wird mit den Namen der generierten Bilddateien ausgefüllt.

Tabelle : 4. Parameter der ConvertToImages-Methode
Parameter Beschreibung Datentyp
Ordnerpfad Der Ordnerpfad, in dem die konvertierten Bilder gespeichert werden. Stellen Sie sicher, dass der Ordner vorhanden ist und über entsprechende Schreibberechtigungen verfügt.

Beispiel: /Anwender/Anwendername/Dokumente/mein Ordner

Zeichenfolge
Dpi Die DPI-Auflösung (Punkte pro Zoll) für die generierten Bilder. Der Standardwert ist 200 DPI. Int32
Qualität Das Qualitätsniveau der generierten Bilder, von 0 (am niedrigsten) bis 100 (am höchsten). Der Standardwert ist 95. Int32

ConvertToWord

Konvertiert eine PDF-Datei in eine Microsoft Word-Dokument.

Rufen Sie diese Methode mit dem Dateipfad auf, in dem das konvertierte Word-Dokument gespeichert werden muss. Die Methode erstellt ein Word-Dokument aus dem PDF-Inhalt im angegebenen Pfad.

Tabelle : 5. Parameter der ConvertToWord-Methode
Parameter Beschreibung Datentyp
WordFilepath Der Dateipfad, in dem das konvertierte Word-Dokument (.doc) gespeichert wird. Stellen Sie sicher, dass der Dateipfad den Dateinamen und die Erweiterung enthält. Zeichenfolge

Konvertieren in Xml

Konvertiert eine angegebene Seite eines PDF-Dokuments in das Microsoft XML-Format. Optional können nur Tabellen konvertiert werden, wenn angegeben.

Rufen Sie diese Methode mit der Seitennummer der zu konvertierenden PDF-Datei, dem Dateipfad, in dem die XML-Ausgabe gespeichert werden muss, und optional festgelegt auf TablesOnly konvertieren Bis Wahr Wenn nur Tabellen konvertiert werden müssen.

Tabelle : 6. Parameter der ConvertToXml-Methode
Parameter Beschreibung Datentyp
Pagennummeriert Die Seitenzahl der PDF-Datei, die in das XML-Format konvertiert werden soll. Seitenzahlen beginnen normalerweise mit 1. Int32
XmlFilePath Der Dateipfad, in dem das konvertierte XML-Dokument gespeichert wird. Stellen Sie sicher, dass der Dateipfad den Dateinamen und die Erweiterung enthält Zeichenfolge
TablesOnly konvertieren Bei „wahr“ werden nur Tabellen von der angegebenen Seite in XML konvertiert. Der Standardwert ist „wahr“. Boolean

ExtractImages

Extrahiert Bilder von angegebenen Seiten eines PDF-Dokuments. Geben Sie optional den Ordnerpfad an, in dem die Bilder gespeichert werden, und eine Ausgabeliste zum Speichern der generierten Dateinamen.

Rufen Sie diese Methode mit dem Ordnerpfad auf, in dem die Bilder gespeichert werden müssen, den Nummern der Start- und Endseite, aus der Bilder extrahiert werden sollen, und einer leeren Liste zum Speichern der Dateinamen der extrahierten Bilder.

Tabelle : 7. Parameter für die Methode „ExtractImages“
Parameter Beschreibung Datentyp
Ordnerpfad Der Ordnerpfad, in dem die extrahierten Bilder gespeichert werden. Stellen Sie sicher, dass der Ordner vorhanden ist und über entsprechende Schreibberechtigungen verfügt. Zeichenfolge
Von Seite Die Nummer der Startseite, von der Bilder extrahiert werden sollen. Seitenzahlen beginnen normalerweise mit 1. Int32
ToPage Die Endseitenzahl, bis zu der Bilder extrahiert werden müssen. Diese Zahl muss größer oder gleich sein Von Seite Nummer. Int32
Dateinamen Ein Ausgabeparameter, der die Dateinamen der extrahierten Bilder speichert. Liste`1

GetAllTables

Extrahiert alle Tabellen aus einem PDF-Dokument und gibt sie als Liste von Datentabellen zurück.

Verwenden Sie Zurück Parameter zum Abrufen der extrahierten Tabellendaten als Liste.

Rufen Sie diese Methode ohne Parameter auf, um alle Tabellen aus dem PDF-Dokument abzurufen. Die Methode gibt eine Liste von Datentabellen zurück, wobei jede DataTable eine aus der PDF extrahierte Tabelle darstellt.

Tabelle : 8. Parameter der Methode „GetAllTables“
Parameter Beschreibung Datentyp
Zurück Diese Methode gibt eine Liste von DataTable zurück, die eine aus der PDF-Datei extrahierte Tabelle darstellt. Liste`1

GetPageAsImage

Extrahiert Daten aus einer PDF-Dokumentseite und speichert sie als in-Memory-Bild.

Gibt eine angegebene Seite eines PDF-Dokuments als speicherinternes Bild zurück.

Rufen Sie diese Methode mit der Seitennummer der PDF-Datei auf, um die Seite als Bild abzurufen. Die Methode gibt die Seite als System.drawing.Image-Objekt zurück.

Tabelle : 9. Parameter der GetPageAsImage-Methode
Parameter Beschreibung Datentyp
Pagennummeriert Die Seitenzahl der PDF-Datei, die in ein Bild konvertiert werden soll. Seitenzahlen beginnen normalerweise mit 1. Int32
Zurück Diese Methode gibt ein Bild zurück, das eine angegebene Seite der PDF-Datei darstellt. Zeichnung.Bild

GetPageCount

Ruft die Gesamtzahl der Seiten in einem PDF-Dokument ab. Sie müssen verwenden Zurück Parameter zum Abrufen der Gesamtseitenzahl in der PDF-Datei als Ganzzahl.

Tabelle : 10. Parameter der Methode „GetPageCount“
Parameter Beschreibung Datentyp
Zurück Diese Methode gibt eine Ganzzahl zurück, die die Anzahl der Seiten der PDF-Datei darstellt. Int32

Gettable

Extrahiert eine Tabelle aus einer PDF-Datei und gibt sie als Datentabelle zurück. Die Extraktionsmethode wird von angegeben Extrahieren nach Parameter.

Rufen Sie diese Methode mit dem Extraktionstyp und dem entsprechenden Wert auf. Die Methode gibt die extrahierte Tabelle als DataTable zurück.

Tabelle : 11. Parameter der gettable-Methode
Parameter Beschreibung Datentyp
Extrahieren nach Die zu verwendende Extraktionsmethode.

Dieser Parameter muss „ExtractType“ sein, der die folgenden Optionen enthält: Index (0) – Extrahieren nach Seitenzahl und ContainsText (1) – Extrahieren nach übereinstimmendem Text.

Extrakttyp
Wert Der Wert, der dem Extraktionstyp entspricht.

Beispiel: Wenn Extrahieren nach Ist Index, dies wäre die Seitenzahl als Zeichenfolge; wenn Extrahieren nach Ist ContainsText, dies wäre der abzugleichende Text.

Zeichenfolge
Zurück Diese Methode gibt eine DataTable zurück, die eine aus der PDF-Datei extrahierte Tabelle darstellt. Tabelle

Gettext

Ruft Text aus dem angegebenen Bereich von PDF-Seiten ab.

Rufen Sie diese Methode mit den Nummern der Start- und Endseite auf, um Text von diesen Seiten abzurufen. Die Methode gibt den extrahierten Text als Zeichenfolge zurück.

Tabelle : 12. Parameter der gettext-Methode
Parameter Beschreibung Datentyp
Von Seite Die Nummer der Startseite des Bereichs, aus dem Text extrahiert werden soll. Seitenzahlen beginnen normalerweise mit 1. Int32
ToPage Die Seitenzahl, zu der Sie Text von der Startseite abrufen.
Hinweis: Stellen Sie sicher, dass der ToPage-Wert höher ist als Von Seite Wert.
Int32
Zurück Diese Methode gibt eine Zeichenfolge zurück, die den Textinhalt der PDF-Datei darstellt. Zeichenfolge

Laden

Lädt eine PDF-Datei für die Interaktion, um weitere Vorgänge wie das Extrahieren von Inhalten zu ermöglichen.

Rufen Sie diese Methode mit dem vollständigen Pfad zur PDF-Datei (Dateipfad) auf, und geben Sie optional ein Passwort (Passwort) an, wenn die PDF-Datei geschützt ist.

Tabelle : 13. Parameter der Lastmethode
Parameter Beschreibung Datentyp
FilePath Der vollständige Pfad zur PDF-Datei, die geladen werden soll. Dies muss den Dateinamen und die Erweiterung enthalten. Zeichenfolge
Passwort Das Passwort für die PDF-Datei, falls sie geschützt ist. Wenn die PDF-Datei nicht passwortgeschützt ist, kann dieser Parameter eine leere Zeichenfolge sein. Zeichenfolge

Zusammenfügung

Führt eine Liste von PDF-Dateien in einer einzelnen PDF-Datei zusammen.

Rufen Sie diese Methode mit einer Liste der Dateipfade der zusammenzuführenden PDFs, dem Ausgabedateipfad und einer optionalen Überschreibkennzeichnung auf.

Tabelle : 14. Parameter der Zusammenführungsmethode
Parameter Beschreibung Datentyp
Dateiliste Eine Liste von Dateipfaden für die zusammenzuführenden PDF-Dateien. Jeder Pfad muss ein gültiger Pfad zu einer PDF-Datei sein. ArrayList
Ausgabedateipfad Der Dateipfad, in dem die zusammengeführte PDF gespeichert wird. Dies muss den Dateinamen und die Erweiterung enthalten. Zeichenfolge
Überschreiben Wenn auf festgelegt Wahr , Die Methode überschreibt die vorhandene Datei im Ausgabepfad, falls vorhanden. Wenn auf festgelegt Falsch , Die Methode überschreibt die vorhandene Datei nicht.

Der Standardwert ist Falsch .

Boolean
Hinweis: Wenn die PDF-Dateien passwortgeschützt sind oder in einem falschen Format in vorliegen Dateiliste Parameter, zeigt die Automatisierung einen Fehler an.

Teilen

Teilt eine einzelne PDF-Datei in mehrere Dateien auf, wobei jede Seite in der PDF-Datei als separate Datei gespeichert wird.

Rufen Sie diese Methode mit dem Ausgabeordnerpfad auf, in dem die geteilten PDF-Seiten gespeichert werden müssen.

Tabelle : 15. Parameter der Aufteilungsmethode
Parameter Beschreibung Datentyp
OutputFolderPath Der Pfad zu dem Ordner, in dem die geteilten PDF-Seiten gespeichert werden. Stellen Sie sicher, dass der Ordner vorhanden ist oder über entsprechende Berechtigungen zum Schreiben von Dateien verfügt. Zeichenfolge