PDF-Connector-Methoden

  • Freigeben Version: Australia
  • Aktualisiert 12. März 2026
  • 8 Minuten Lesedauer
  • Beschleunigen Sie die PDF-Verarbeitung für Ihre Dokumentautomatisierung, indem Sie die verschiedenen Methoden des PDF-Connectors in verwenden RPA Desktop Design Studio.

    Voraussetzungen für die Verwendung des PDF-Connectors

    Verwenden Sie die Methode Laden im PDF-Connector, bevor Sie die anderen Methoden verwenden. Rufen Sie diese Methode mit dem vollständigen Pfad zur PDF-Datei (Dateipfad) auf, und geben Sie optional ein Passwort (Passwort) an, wenn die PDF-Datei geschützt ist.

    Schließen

    Schließt die dem PDF-Dokument zugeordneten Ressourcen. Verwenden Sie diese Methode, um alle Referenzen und Ressourcen nach Verwendung der Methode „Laden“ freizugeben.

    Rufen Sie diese Methode auf, wenn Sie das PDF-Dokument nicht mehr verwenden müssen oder nachdem Sie Vorgänge damit abgeschlossen haben.

    In Excel konvertieren

    Konvertiert ein PDF-Dokument in ein Microsoft Excel-Dokument. Optional können nur Tabellen konvertiert werden, wenn angegeben.

    Rufen Sie diese Methode mit dem Dateipfad auf, in dem das konvertierte Excel-Dokument gespeichert und optional festgelegt werden muss Nur Tabellenkonvertieren Bis Wahr Wenn nur Tabellen konvertiert werden müssen.

    Tabelle : 1. Parameter der ConvertToExcel-Methode
    Parameter Beschreibung Datentyp
    ExcelFilepath Der Dateipfad, in dem das konvertierte Excel-Dokument (.xlsx) gespeichert wird. Stellen Sie sicher, dass der Dateipfad den Dateinamen und die Erweiterung enthält. Zeichenfolge
    Nur Tabellenkonvertieren Wenn auf festgelegt Wahr , Nur Tabellen aus dem PDF-Dokument werden in Excel konvertiert. Standard ist Wahr . Boolean

    In HTML konvertieren

    Konvertiert eine angegebene Seite einer PDF in das HTML-Format. Wenn die Seitenzahl kleiner oder gleich 0 ist, werden alle Seiten der PDF in HTML konvertiert.

    Rufen Sie diese Methode mit der Seitennummer der PDF auf, die Sie in HTML konvertieren möchten. Wenn Sie eine Seitenzahl kleiner oder gleich 0 übergeben, wird die gesamte PDF in HTML konvertiert. Die Methode gibt den HTML-Inhalt als Zeichenfolge zurück.

    Tabelle : 2. Parameter der ConvertToHTML-Methode
    Parameter Beschreibung Datentyp
    Seitennummer (Daten in) Die Seitennummer der PDF, die in HTML konvertiert werden soll. Wenn dieser Parameter kleiner oder gleich 0 ist, werden alle Seiten der PDF in HTML konvertiert. Seitenzahlen beginnen normalerweise mit 1. Int32
    Rückgabe (Datenausgang) Diese Methode gibt den HTML-Inhalt als Zeichenfolge zurück, die den Inhalt der PDF-Datei darstellt. Zeichenfolge

    In Bild konvertieren

    Konvertiert eine angegebene Seite eines PDF-Dokuments in ein Bild. Geben Sie optional den Bildpfad an, in dem das Bild gespeichert wird, DPI (Punkte pro Zoll) und die Bildqualität.

    Rufen Sie diese Methode mit der Seitennummer der zu konvertierenden PDF-Datei, dem Dateipfad, in dem das Bild gespeichert werden muss, und passen Sie optional die DPI- und Bildqualitätsparameter an.

    Tabelle : 3. Parameter der ConvertToImage-Methode
    Parameter Beschreibung Datentyp
    PageNumber Die Seitennummer der PDF, die in ein Bild konvertiert werden soll. Seitenzahlen beginnen normalerweise mit 1. Int32
    Bildpfad Der Dateipfad, in dem das konvertierte Bild gespeichert wird. Stellen Sie sicher, dass der Dateipfad den Dateinamen und die Erweiterung enthält Zeichenfolge
    Dpi Die Auflösung von DPI (Punkte pro Zoll) für das generierte Bild. Der Standardwert ist 200 dpi. Int32
    Qualität Die Qualitätsstufe des generierten Bilds, von 0 (am niedrigsten) bis 100 (am höchsten). Der Standardwert ist 95. Int32

    Konvertiertin Bilder

    Konvertiert ein PDF-Dokument in Bilder. Geben Sie optional den Ordnerpfad an, in dem die Bilder gespeichert werden, DPI (Punkte pro Zoll), Bildqualität und eine optionale Liste zum Speichern der generierten Dateinamen.

    Rufen Sie diese Methode mit dem Ordnerpfad auf, in dem die Bilder gespeichert werden müssen. Passen Sie optional die DPI- und Bildqualitätsparameter an. Wenn Sie eine Liste als angeben Dateinamen Parameter, wird mit den Namen der generierten Bilddateien ausgefüllt.

    Tabelle : 4. Parameter der ConvertToImages-Methode
    Parameter Beschreibung Datentyp
    Ordnerpfad Der Ordnerpfad, in dem die konvertierten Bilder gespeichert werden. Stellen Sie sicher, dass der Ordner vorhanden ist und über entsprechende Schreibberechtigungen verfügt.

    Beispiel: /Anwender/Anwendername/Dokumente/mein Ordner

    Zeichenfolge
    Dpi Die Auflösung von DPI (Punkte pro Zoll) für die generierten Bilder. Der Standardwert ist 200 dpi. Int32
    Qualität Das Qualitätsniveau der generierten Bilder, von 0 (am niedrigsten) bis 100 (am höchsten). Der Standardwert ist 95. Int32

    Konvertierenin Wort

    Konvertiert eine PDF in eine Microsoft Word-Dokument.

    Rufen Sie diese Methode mit dem Dateipfad auf, in dem das konvertierte Word-Dokument gespeichert werden muss. Die Methode erstellt ein Word-Dokument aus dem PDF-Inhalt im angegebenen Pfad.

    Tabelle : 5. Parameter der ConvertToWord-Methode
    Parameter Beschreibung Datentyp
    WordFilePath Der Dateipfad, in dem das konvertierte Word-Dokument (.doc) gespeichert wird. Stellen Sie sicher, dass der Dateipfad den Dateinamen und die Erweiterung enthält. Zeichenfolge

    Konvertieren in Xml

    Konvertiert eine angegebene Seite eines PDF-Dokuments in das Microsoft XML-Format. Optional können nur Tabellen konvertiert werden, wenn angegeben.

    Rufen Sie diese Methode mit der Seitennummer der zu konvertierenden PDF, dem Dateipfad, in dem die XML-Ausgabe gespeichert werden muss, und optional festgelegt auf Nur Tabellenkonvertieren Bis Wahr Wenn nur Tabellen konvertiert werden müssen.

    Tabelle : 6. Parameter der ConvertToXml-Methode
    Parameter Beschreibung Datentyp
    PageNumber Die Seitennummer der PDF, die in das XML-Format konvertiert werden soll. Seitenzahlen beginnen normalerweise mit 1. Int32
    XmlDateipfad Der Dateipfad, in dem das konvertierte XML-Dokument gespeichert wird. Stellen Sie sicher, dass der Dateipfad den Dateinamen und die Erweiterung enthält Zeichenfolge
    Nur Tabellenkonvertieren Bei „wahr“ werden nur Tabellen von der angegebenen Seite in XML konvertiert. Der Standardwert ist „wahr“. Boolean

    Extraktionsbilder

    Extrahiert Bilder aus den angegebenen Seiten eines PDF-Dokuments. Geben Sie optional den Ordnerpfad an, in dem die Bilder gespeichert werden, und eine Ausgabeliste zum Speichern der generierten Dateinamen.

    Rufen Sie diese Methode mit dem Ordnerpfad auf, in dem die Bilder gespeichert werden müssen, den Start- und Endseitenzahlen, aus denen Bilder extrahiert werden sollen, und einer leeren Liste zum Speichern der Dateinamen der extrahierten Bilder.

    Tabelle : 7. Parameter für die Methode „ExtractImages“
    Parameter Beschreibung Datentyp
    Ordnerpfad Der Ordnerpfad, in dem die extrahierten Bilder gespeichert werden. Stellen Sie sicher, dass der Ordner vorhanden ist und über entsprechende Schreibberechtigungen verfügt. Zeichenfolge
    Von Seite Die Nummer der Startseite, von der Bilder extrahiert werden sollen. Seitenzahlen beginnen normalerweise mit 1. Int32
    Bis Seite Die Endseitenzahl, bis zu der Bilder extrahiert werden müssen. Diese Zahl muss größer oder gleich sein Von Seite Nummer. Int32
    Dateinamen Ein Ausgabeparameter, der die Dateinamen der extrahierten Bilder speichert. Liste`1

    GetAllTabellen

    Extrahiert alle Tabellen aus einem PDF-Dokument und gibt sie als Liste von Datentabellen zurück.

    Verwenden Sie Zurück Parameter zum Abrufen der extrahierten Tabellendaten als Liste.

    Rufen Sie diese Methode ohne Parameter auf, um alle Tabellen aus dem PDF-Dokument abzurufen. Die Methode gibt eine Liste von Datentabellen zurück, wobei jede Datentabelle eine aus der PDF extrahierte Tabelle darstellt.

    Tabelle : 8. Parameter der Methode „GetAllTables“
    Parameter Beschreibung Datentyp
    Zurück Diese Methode gibt eine Liste von Datentabellen zurück, die eine aus der PDF-Datei extrahierte Tabelle darstellt. Liste`1

    PageAsImage abrufen

    Extrahiert Daten aus einer PDF-Dokumentseite und speichert sie als speicherinternes Bild.

    Gibt eine angegebene Seite eines PDF-Dokuments als speicherinternes Bild zurück.

    Rufen Sie diese Methode mit der Seitennummer der PDF auf, um die Seite als Bild abzurufen. Die Methode gibt die Seite als Objekt „System.drawing.Image“ zurück.

    Tabelle : 9. Parameter der Methode „GetPageAsImage“
    Parameter Beschreibung Datentyp
    PageNumber Die Seitennummer der PDF, die in ein Bild konvertiert werden soll. Seitenzahlen beginnen normalerweise mit 1. Int32
    Zurück Diese Methode gibt ein Bild zurück, das eine angegebene Seite der PDF-Datei darstellt. Zeichnung.Bild

    PageCount abrufen

    Ruft die Gesamtzahl der Seiten in einem PDF-Dokument ab. Sie müssen verwenden Zurück Parameter zum Abrufen der Gesamtseitenzahl in der PDF-Datei als Ganzzahl.

    Tabelle : 10. Parameter der Methode „GetPageCount“
    Parameter Beschreibung Datentyp
    Zurück Diese Methode gibt eine Ganzzahl zurück, die die Anzahl der Seiten der PDF-Datei darstellt. Int32

    Gettable

    Extrahiert eine Tabelle aus einer PDF-Datei und gibt sie als Datentabelle zurück. Die Extraktionsmethode wird von angegeben Extrahieren nach Parameter.

    Rufen Sie diese Methode mit dem Extraktionstyp und dem entsprechenden Wert auf. Die Methode gibt die extrahierte Tabelle als Datentabelle zurück.

    Tabelle : 11. Parameter der gettable-Methode
    Parameter Beschreibung Datentyp
    Extrahieren nach Die zu verwendende Extraktionsmethode.

    Dieser Parameter muss „ExtractType“ sein, der die folgenden Optionen enthält: Index (0) – nach Seitenzahl extrahieren, und ContainsText (1) – Extrahieren nach übereinstimmendem Text.

    Extrakttyp
    Wert Der Wert, der dem Extraktionstyp entspricht.

    Beispiel: Wenn Extrahieren nach Ist Index, dies wäre die Seitenzahl als Zeichenfolge; wenn Extrahieren nach Ist ContainsText, dies wäre der abzugleichende Text.

    Zeichenfolge
    Zurück Diese Methode gibt eine Datentabelle zurück, die eine aus der PDF-Datei extrahierte Tabelle darstellt. Tabelle

    Gettext

    Ruft Text aus dem angegebenen Bereich von PDF-Seiten ab.

    Rufen Sie diese Methode mit den Nummern der Start- und Endseite auf, um Text von diesen Seiten abzurufen. Die Methode gibt den extrahierten Text als Zeichenfolge zurück.

    Tabelle : 12. Parameter der gettext-Methode
    Parameter Beschreibung Datentyp
    Von Seite Die Startseitennummer des Bereichs, aus dem Text extrahiert werden soll. Seitenzahlen beginnen normalerweise mit 1. Int32
    Bis Seite Die Seitenzahl, zu der Sie Text von der Startseite abrufen.
    Hinweis:
    Stellen Sie sicher, dass der Wert „ToPage“ höher ist als Von Seite Wert.
    Int32
    Zurück Diese Methode gibt eine Zeichenfolge zurück, die den Textinhalt der PDF-Datei darstellt. Zeichenfolge

    Laden

    Lädt eine PDF-Datei für die Interaktion, um weitere Vorgänge wie das Extrahieren von Inhalten zu ermöglichen.

    Rufen Sie diese Methode mit dem vollständigen Pfad zur PDF-Datei (Dateipfad) auf, und geben Sie optional ein Passwort (Passwort) an, wenn die PDF-Datei geschützt ist.

    Tabelle : 13. Parameter der Lademethode
    Parameter Beschreibung Datentyp
    Dateipfad Der vollständige Pfad zur PDF-Datei, die geladen werden soll. Dies muss den Dateinamen und die Erweiterung enthalten. Zeichenfolge
    Passwort Das Passwort für die PDF-Datei, falls sie geschützt ist. Wenn die PDF nicht passwortgeschützt ist, kann dieser Parameter eine leere Zeichenfolge sein. Zeichenfolge

    Zusammenfügung

    Führt eine Liste von PDF-Dateien in einer einzelnen PDF-Datei zusammen.

    Rufen Sie diese Methode mit einer Liste der Dateipfade der zusammenzuführenden PDFs, dem Ausgabedateipfad und einer optionalen Überschreibkennzeichnung auf.

    Tabelle : 14. Parameter der Zusammenführungsmethode
    Parameter Beschreibung Datentyp
    Filliste Eine Liste von Dateipfaden für die zusammenzuführenden PDF-Dateien. Jeder Pfad muss ein gültiger Pfad zu einer PDF-Datei sein. ArrayList
    Ausgabedateipfad Der Dateipfad, in dem die zusammengeführte PDF gespeichert wird. Dies muss den Dateinamen und die Erweiterung enthalten. Zeichenfolge
    Überschreiben Wenn auf festgelegt Wahr , Die Methode überschreibt die vorhandene Datei am Ausgabepfad, falls vorhanden. Wenn auf festgelegt Falsch , Die Methode überschreibt die vorhandene Datei nicht.

    Standard ist Falsch .

    Boolean
    Hinweis:
    Wenn die PDF-Dateien passwortgeschützt sind oder in einem falschen Format in vorliegen Filliste Parameter, zeigt die Automatisierung einen Fehler an.

    Teilen

    Teilt eine einzelne PDF in mehrere Dateien auf, wobei jede Seite in der PDF als separate Datei gespeichert wird.

    Rufen Sie diese Methode mit dem Ausgabeordnerpfad auf, in dem die geteilten PDF-Seiten gespeichert werden müssen.

    Tabelle : 15. Parameter der Trennungsmethode
    Parameter Beschreibung Datentyp
    AusgabeFolderPath Der Pfad zum Ordner, in dem die geteilten PDF-Seiten gespeichert werden. Stellen Sie sicher, dass der Ordner vorhanden ist oder über entsprechende Berechtigungen zum Schreiben von Dateien verfügt. Zeichenfolge