Méthodes de connecteur PDF

  • Rversion finale: Australia
  • Mis à jour 12 mars 2026
  • 10 minutes de lecture
  • Accélérez le traitement PDF pour l’automatisation de vos documents en utilisant les différentes méthodes du connecteur PDF dans Studio de conception de bureau de RPA.

    Conditions préalables à l’utilisation du connecteur PDF

    Utilisez la méthode Charger dans le connecteur PDF avant d’utiliser les autres méthodes. Appelez cette méthode avec le chemin d’accès complet au fichier PDF (FilePath) et fournissez éventuellement un mot de passe (Mot de passe) si le PDF est protégé.

    Fermer

    Ferme les ressources associées au document PDF. Utilisez cette méthode pour libérer les références et les ressources après avoir utilisé la méthode Load.

    Appelez cette méthode lorsque vous n’avez plus besoin d’utiliser le document PDF ou après avoir effectué des opérations avec celui-ci.

    Convertir en Excel

    Convertit un document PDF en Microsoft document Excel. Si cette option est spécifiée, seules les tables peuvent être converties.

    Appelez cette méthode avec le chemin d’accès au fichier dans lequel le document Excel converti doit être enregistré, et définissez éventuellement ConvertTablesOnly sur True si seules les tables doivent être converties.

    Tableau 1. Paramètres de la méthode ConvertToExcel
    Paramètre Description Type de données
    Chemin d’accès au fichier Excel Chemin d’accès du fichier où le document Excel converti (.xlsx) est enregistré. Assurez-vous que le chemin d’accès du fichier inclut le nom et l’extension du fichier. Chaîne
    ConvertTablesOnly Si la valeur est définie sur Vrai, seules les tables du document PDF sont converties en Excel. La valeur par défaut est Vrai. Booléen

    ConvertToHTML

    Convertit une page spécifiée d’un PDF au format HTML. Si le numéro de page est inférieur ou égal à 0, toutes les pages du PDF sont converties en HTML.

    Appelez cette méthode avec le numéro de page du PDF que vous souhaitez convertir en HTML. Si vous transmettez un numéro de page inférieur ou égal à 0, l’intégralité du PDF sera convertie en HTML. La méthode renvoie le contenu HTML sous forme de chaîne.

    Tableau 2. Paramètres de la méthode ConvertToHTML
    Paramètre Description Type de données
    Numéro de page (entrées de données) Numéro de page du PDF à convertir en HTML. Si ce paramètre est inférieur ou égal à 0, toutes les pages du PDF sont converties en HTML. Les numéros de page commencent généralement par 1. Int32
    Retour (données sorties) Cette méthode renvoie le contenu HTML sous forme de chaîne, représentant le contenu du fichier PDF. Chaîne

    ConvertToImage

    Convertit une page spécifiée d’un document PDF en image. Vous pouvez également spécifier le chemin d’accès de l’image où l’image est enregistrée, le PPP (points par pouce) et la qualité de l’image.

    Appelez cette méthode avec le numéro de page du PDF à convertir, le chemin d’accès au fichier où l’image doit être enregistrée et ajustez éventuellement les paramètres PPP et qualité de l’image.

    Tableau 3. Paramètres de la méthode ConvertToImage
    Paramètre Description Type de données
    PageNumber Numéro de page du PDF à convertir en image. Les numéros de page commencent généralement par 1. Int32
    Chemin d’image Chemin d’accès au fichier où l’image convertie est enregistrée. Assurez-vous que le chemin d’accès du fichier inclut le nom et l’extension du fichier Chaîne
    PPP Résolution PPP (points par pouce) de l’image générée. La valeur par défaut est de 200 ppp. Int32
    Qualité Niveau de qualité de l’image générée, compris entre 0 (le plus bas) et 100 (le plus élevé). La valeur par défaut est 95. Int32

    ConvertToImages

    Convertit un document PDF en images. Vous pouvez également spécifier le chemin du dossier où les images sont enregistrées, les PPP (points par pouce), la qualité de l’image et une liste facultative pour stocker les noms de fichiers générés.

    Appelez cette méthode avec le chemin du dossier où les images doivent être enregistrées. Vous pouvez également régler les paramètres DPI et qualité d’image. Si vous fournissez une liste en tant que paramètre FileNames , elle est remplie avec les noms des fichiers image générés.

    Tableau 4. Paramètres de la méthode ConvertToImages
    Paramètre Description Type de données
    Chemin d’accès du dossier Le chemin du dossier dans lequel les images converties seront enregistrées. Assurez-vous que le dossier existe et qu’il dispose des autorisations d’écriture appropriées.

    Par exemple, /Users/Username/Documents/MyFolder

    Chaîne
    PPP Résolution PPP (points par pouce) des images générées. La valeur par défaut est de 200 ppp. Int32
    Qualité Niveau de qualité des images générées, allant de 0 (le plus bas) à 100 (le plus élevé). La valeur par défaut est 95. Int32

    ConvertToWord

    Convertit un PDF en Microsoft document Word.

    Appelez cette méthode avec le chemin d’accès au fichier où le document Word converti doit être enregistré. La méthode crée un document Word à partir du contenu PDF sur le chemin d’accès spécifié.

    Tableau 5. Paramètre de la méthode ConvertToWord
    Paramètre Description Type de données
    Chemin d’accès du fichier Word Chemin d’accès au fichier où le document Word converti (.doc) est enregistré. Assurez-vous que le chemin d’accès du fichier inclut le nom et l’extension du fichier. Chaîne

    ConvertToXml

    Convertit une page spécifiée d’un document PDF au format Microsoft XML. Si cette option est spécifiée, seules les tables peuvent être converties.

    Appelez cette méthode avec le numéro de page du fichier PDF à convertir, le chemin d’accès au fichier dans lequel la sortie XML doit être enregistrée, et définissez éventuellement ConvertTablesOnly sur True si seules les tables doivent être converties.

    Tableau 6. Paramètres de la méthode ConvertToXml
    Paramètre Description Type de données
    PageNumber Numéro de page du PDF à convertir au format XML. Les numéros de page commencent généralement par 1. Int32
    Chemin d’accès au fichier XML Chemin d’accès au fichier où le document XML converti sera enregistré. Assurez-vous que le chemin d’accès du fichier inclut le nom et l’extension du fichier Chaîne
    ConvertTablesOnly Si la valeur est définie sur True, seules les tables de la page spécifiée seront converties en XML. La valeur par défaut est Vrai. Booléen

    Extraire les images

    Extrait les images des pages spécifiées d’un document PDF. Vous pouvez également spécifier le chemin vers le dossier dans lequel les images sont enregistrées et une liste de sortie pour stocker les noms de fichiers générés.

    Appelez cette méthode avec le chemin du dossier où les images doivent être enregistrées, les numéros de page de début et de fin à partir desquels extraire les images et une liste vide pour stocker les noms de fichiers des images extraites.

    Tableau 7. Paramètres de la méthode ExtractImages
    Paramètre Description Type de données
    Chemin d’accès du dossier Le chemin vers le dossier où les images extraites sont enregistrées. Assurez-vous que le dossier existe et qu’il dispose des autorisations d’écriture appropriées. Chaîne
    FromPage (De la page) Numéro de la page de démarrage à partir de laquelle extraire les images. Les numéros de page commencent généralement par 1. Int32
    ToPage Numéro de la page de fin jusqu’à laquelle les images doivent être extraites. Ce nombre doit être supérieur ou égal au numéro FromPage . Int32
    Noms de fichiers Paramètre de sortie qui stocke les noms de fichier des images extraites. Liste 1

    GetAllTables

    Extrait toutes les tables d’un document PDF et les renvoie sous forme de liste de tables de données.

    Utilisez le paramètre Retour pour récupérer les données de table extraites sous forme de liste.

    Appelez cette méthode sans aucun paramètre pour récupérer toutes les tables du document PDF. La méthode retourne une liste de tables de données, où chaque table de données représente une table extraite du PDF.

    Tableau 8. Paramètre de la méthode GetAllTables
    Paramètre Description Type de données
    Retour Cette méthode renvoie la liste de DataTable qui représente une table extraite du fichier PDF. Liste 1

    GetPageAsImage

    Extrait les données d’une page de document PDF et les stocke en tant qu’image en mémoire.

    Renvoie une page spécifiée d’un document PDF sous forme d’image en mémoire.

    Appelez cette méthode avec le numéro de page du PDF pour récupérer la page sous forme d’image. La méthode renvoie la page sous forme d’objet System.Drawing.Image.

    Tableau 9. Paramètres de la méthode GetPageAsImage
    Paramètre Description Type de données
    PageNumber Numéro de page du PDF à convertir en image. Les numéros de page commencent généralement par 1. Int32
    Retour Cette méthode renvoie une image qui représente une page spécifiée du fichier PDF. Dessin.Image

    GetPageCount

    Récupère le nombre total de pages dans un document PDF. Vous devez utiliser le paramètre Retour pour récupérer le nombre total de pages dans le PDF sous forme de nombre entier.

    Tableau 10. Paramètre de la méthode GetPageCount
    Paramètre Description Type de données
    Retour Cette méthode renvoie un nombre entier représentant le nombre de pages du fichier PDF. Int32

    GetTable (Table à obtenir)

    Extrait une table d’un PDF et la renvoie en tant que table de données. La méthode d’extraction est spécifiée par le paramètre ExtractBy .

    Appelez cette méthode avec le type d’extraction et la valeur correspondante. La méthode renvoie la table extraite sous forme de table de données.

    Tableau 11. Paramètres de la méthode GetTable
    Paramètre Description Type de données
    Extrait par La méthode d’extraction à utiliser.

    Ce paramètre doit être ExtractType, qui inclut les options suivantes : Index (0) : extraire par numéro de page et ContainsText (1) : extraire en faisant correspondre le texte.

    Type d’extraction
    Valeur La valeur correspondant au type d’extraction.

    Par exemple, si ExtractBy est Index, il s’agit du numéro de page sous forme de chaîne ; si ExtractBy est ContainsText, il s’agit du texte à faire correspondre.

    Chaîne
    Retour Cette méthode renvoie une table de données qui représente une table extraite du fichier PDF. Table

    GetText

    Récupère le texte à partir de la plage donnée de pages PDF.

    Appelez cette méthode avec les numéros de page de début et de fin pour récupérer le texte de ces pages. La méthode renvoie le texte extrait sous forme de chaîne.

    Tableau 12. Paramètres de la méthode GetText
    Paramètre Description Type de données
    FromPage (De la page) Numéro de la page de début de la plage à partir de laquelle extraire le texte. Les numéros de page commencent généralement par 1. Int32
    ToPage Numéro de la page vers laquelle vous récupérez le texte à partir de la page de démarrage.
    Remarque :
    Assurez-vous que la valeur ToPage est supérieure à la valeur FromPage .
    Int32
    Retour Cette méthode renvoie une chaîne représentant le contenu textuel du fichier PDF. Chaîne

    Charge

    Charge un fichier PDF pour l’interaction, permettant d’autres opérations telles que l’extraction de contenu.

    Appelez cette méthode avec le chemin d’accès complet au fichier PDF (FilePath) et fournissez éventuellement un mot de passe (Mot de passe) si le PDF est protégé.

    Tableau 13. Paramètres de la méthode de charge
    Paramètre Description Type de données
    Chemin d’accès au fichier Le chemin complet vers le fichier PDF à charger. Cela doit inclure le nom du fichier et l’extension. Chaîne
    Mot de passe Le mot de passe du fichier PDF, s’il est protégé. Si le PDF n’est pas protégé par mot de passe, ce paramètre peut être une chaîne vide. Chaîne

    Fusionner

    Fusionne une liste de fichiers PDF en un seul fichier PDF.

    Appelez cette méthode avec une liste des chemins d’accès des fichiers PDF à fusionner, le chemin d’accès au fichier de sortie et un marqueur d’écrasement facultatif.

    Tableau 14. Paramètres de la méthode de fusion
    Paramètre Description Type de données
    Liste de fichiers Liste des chemins d’accès aux fichiers PDF à fusionner. Chaque chemin d’accès doit être un chemin d’accès valide à un fichier PDF. Liste de tableaux
    Chemin d’accès au fichier de sortie Chemin d’accès au fichier dans lequel le PDF fusionné est enregistré. Cela doit inclure le nom du fichier et l’extension. Chaîne
    Remplacer Si la valeur est définie sur True, la méthode écrase le fichier existant au niveau du chemin de sortie s’il existe. Si la valeur est définie sur False, la méthode n’écrase pas le fichier existant.

    La valeur par défaut est Faux.

    Booléen
    Remarque :
    Si les fichiers PDF sont protégés par un mot de passe ou dans un format incorrect dans le paramètre FileList , l’automatisation affiche une erreur.

    Division

    Divise un PDF unique en plusieurs fichiers, où chaque page du PDF est enregistrée dans un fichier distinct.

    Appelez cette méthode avec le chemin du dossier de sortie où les pages PDF fractionnées doivent être enregistrées.

    Tableau 15. Paramètre de la méthode de fractionnement
    Paramètre Description Type de données
    Chemin d’accès du dossier de sortie Le chemin vers le dossier où les pages PDF fractionnées sont enregistrées. Assurez-vous que le dossier existe ou qu’il dispose des autorisations appropriées pour écrire des fichiers. Chaîne