Métodos do conector de PDF

  • Versão de lançamento: Australia
  • Atualizado 12 de mar. de 2026
  • 9 min. de leitura
  • Acelere o processamento de PDF para a automação de documentos usando os vários métodos do conector de PDF no Design studio de RPA para desktop.

    Pré-requisitos para usar o Conector de PDF

    Use o Método Carregar no Conector PDF antes de usar os outros métodos. Chame este método com o caminho completo para o arquivo PDF (FilePath) e, opcionalmente, forneça uma senha (Senha) se o PDF estiver protegido.

    Fechar

    Fecha os recursos associados ao documento PDF. Use este método para liberar referências e recursos depois de usar o método Carregar.

    Chame este método quando você não precisar mais usar o documento PDF ou depois de concluir operações com ele.

    Convertpara Excel

    Converte um documento PDF em Microsoft Documento do Excel. Se especificado, somente tabelas podem ser convertidas.

    Chame este método com o caminho do arquivo onde o documento do Excel convertido deve ser salvo e opcionalmente definido ConvertTablesOnly para Verdadeiro se somente as tabelas precisarem ser convertidas.

    Tabela 1. Parâmetros do método ConvertToExcel
    Parâmetro Descrição Tipo de dados
    ExcelFilePath O caminho do arquivo em que o documento do Excel convertido (.xlsx) é salvo. Certifique-se de que o caminho do arquivo inclua o nome e a extensão do arquivo. Cadeia de caracteres
    ConvertTablesOnly Se definido como Verdadeiro , Somente tabelas do documento PDF são convertidas em Excel. O padrão é Verdadeiro . Booliano

    ConvertToHTML

    Converte uma página especificada de um PDF para o formato HTML. Se o número da página for menor ou igual a 0, todas as páginas do PDF serão convertidas em HTML.

    Chame este método com o número de página do PDF que você deseja converter em HTML. Se você passar um número de página menor ou igual a 0, todo o PDF será convertido em HTML. O método retorna o conteúdo HTML como uma cadeia de caracteres.

    Tabela 2. Parâmetros do método ConvertToHTML
    Parâmetro Descrição Tipo de dados
    Número de página (Dados em) O número da página do PDF a ser convertido em HTML. Se este parâmetro for menor ou igual a 0, todas as páginas do PDF serão convertidas em HTML. Os números de página normalmente começam em 1. Int32
    Retorno (saída de dados) Este método retorna o conteúdo HTML como uma cadeia de caracteres, representando o conteúdo do arquivo PDF. Cadeia de caracteres

    ConvertToImage

    Converte uma página especificada de um documento PDF em uma imagem. Opcionalmente, especifique o caminho da imagem onde a imagem será salva, DPI (pontos por polegada) e a qualidade da imagem.

    Chame este método com o número da página do PDF a ser convertido, o caminho do arquivo onde a imagem deve ser salva e, opcionalmente, ajuste os parâmetros de DPI e qualidade da imagem.

    Tabela 3. Parâmetros do método ConvertToImage
    Parâmetro Descrição Tipo de dados
    PageNumber O número da página do PDF a ser convertido em uma imagem. Os números de página normalmente começam em 1. Int32
    Caminho da imagem O caminho do arquivo em que a imagem convertida é salva. Certifique-se de que o caminho do arquivo inclua o nome e a extensão do arquivo Cadeia de caracteres
    Dpi A resolução de DPI (pontos por polegada) da imagem gerada. O padrão é 200 DPI. Int32
    Qualidade O nível de qualidade da imagem gerada, variando de 0 (mais baixo) a 100 (mais alto). O padrão é 95. Int32

    ConvertToImagens

    Converte um documento PDF em imagens. Opcionalmente, especifique o caminho da pasta onde as imagens são salvas, DPI (pontos por polegada), qualidade da imagem e uma lista opcional para armazenar os nomes dos arquivos gerados.

    Chame este método com o caminho da pasta onde as imagens devem ser salvas. Como opção, ajuste os parâmetros de DPI e qualidade da imagem. Se você fornecer uma lista como Nomes de arquivo parâmetro, ele é preenchido com os nomes dos arquivos de imagem gerados.

    Tabela 4. Parâmetros do método ConvertToImages
    Parâmetro Descrição Tipo de dados
    Caminho da pasta O caminho da pasta onde as imagens convertidas serão salvas. Certifique-se de que a pasta exista e tenha permissões de gravação apropriadas.

    Por exemplo, /Usuários/Nome de usuário/Documentos/Minha pasta

    Cadeia de caracteres
    Dpi A resolução de DPI (pontos por polegada) das imagens geradas. O padrão é 200 DPI. Int32
    Qualidade O nível de qualidade das imagens geradas, variando de 0 (mais baixo) a 100 (mais alto). O padrão é 95. Int32

    ConvertToWord

    Converte um PDF em Microsoft Documento do Word.

    Chame este método com o caminho do arquivo onde o documento convertido do Word deve ser salvo. O método cria um documento do Word a partir do conteúdo PDF no caminho especificado.

    Tabela 5. Parâmetro do método ConvertToWord
    Parâmetro Descrição Tipo de dados
    Caminho do WordFilePath O caminho do arquivo onde o documento convertido do Word (.doc) é salvo. Certifique-se de que o caminho do arquivo inclua o nome e a extensão do arquivo. Cadeia de caracteres

    ConvertToXml

    Converte uma página especificada de um documento PDF para o formato Microsoft XML. Se especificado, somente tabelas podem ser convertidas.

    Chame este método com o número da página do PDF a ser convertido, o caminho do arquivo onde a saída XML deve ser salva e opcionalmente definida ConvertTablesOnly para Verdadeiro se somente as tabelas precisarem ser convertidas.

    Tabela 6. Parâmetros do método ConvertToXml
    Parâmetro Descrição Tipo de dados
    PageNumber O número da página do PDF a ser convertido para o formato XML. Os números de página normalmente começam em 1. Int32
    XmlFilePath O caminho do arquivo onde o documento XML convertido será salvo. Certifique-se de que o caminho do arquivo inclua o nome e a extensão do arquivo Cadeia de caracteres
    ConvertTablesOnly Se definido como verdadeiro, somente as tabelas da página especificada serão convertidas em XML. O padrão é verdadeiro. Booliano

    ExtractImages

    Extrai imagens de páginas especificadas de um documento PDF. Como opção, especifique o caminho da pasta onde as imagens são salvas e uma lista de saída para armazenar os nomes dos arquivos gerados.

    Chame este método com o caminho da pasta onde as imagens devem ser salvas, os números de página inicial e final da qual extrair imagens e uma lista vazia para armazenar os nomes de arquivo das imagens extraídas.

    Tabela 7. Parâmetros para o método ExtractImages
    Parâmetro Descrição Tipo de dados
    Caminho da pasta O caminho da pasta onde as imagens extraídas são salvas. Certifique-se de que a pasta exista e tenha permissões de gravação apropriadas. Cadeia de caracteres
    Página O número da página inicial da qual extrair as imagens. Os números de página normalmente começam em 1. Int32
    Página O número da página final até o qual as imagens devem ser extraídas. Este número deve ser maior ou igual a Página número. Int32
    Nomes de arquivo Um parâmetro de saída que armazena os nomes de arquivo das imagens extraídas. Lista'1

    GetAllTables

    Extrai todas as tabelas de um documento PDF e as retorna como uma lista de Tabelas de dados.

    Use o. Retorno parâmetro para recuperar os dados da tabela extraídos como uma lista.

    Chame este método sem parâmetros para recuperar todas as tabelas do documento PDF. O método retorna uma lista de DataTables, em que cada DataTable representa uma tabela extraída do PDF.

    Tabela 8. Parâmetro do método GetAllTables
    Parâmetro Descrição Tipo de dados
    Retornar Este método retorna a lista de DataTable que representa tabelas extraídas do arquivo PDF. Lista'1

    Obter PageAsImage

    Extrai dados de uma página de documento PDF e armazena-os como uma imagem na memória.

    Retorna uma página especificada de um documento PDF como uma imagem na memória.

    Chame este método com o número de página do PDF para recuperar a página como uma imagem. O método retorna a página como um objeto System.Drawing.Image.

    Tabela 9. Parâmetros do método GetPageAsImage
    Parâmetro Descrição Tipo de dados
    PageNumber O número da página do PDF a ser convertido em uma imagem. Os números de página normalmente começam em 1. Int32
    Retornar Este método retorna uma imagem que representa uma página especificada do arquivo PDF. Imagem.Desenho

    GetPageCount

    Recupera o número total de páginas em um documento PDF. Você deve usar o. Retorno Parâmetro para recuperar a contagem total de páginas no PDF como um número inteiro.

    Tabela 10. Parâmetro do método GetPageCount
    Parâmetro Descrição Tipo de dados
    Retornar Este método retorna um número inteiro que representa a contagem de páginas do arquivo PDF. Int32

    Obter tabela

    Extrai uma tabela de um PDF e a retorna como uma DataTable. O método de extração é especificado pelo ExtractBy parâmetro.

    Chame este método com o tipo de extração e o valor correspondente. O método retorna a tabela extraída como uma DataTable.

    Tabela 11. Parâmetros do método GetTable
    Parâmetro Descrição Tipo de dados
    ExtractBy O método de extração a ser usado.

    Este parâmetro deve ser ExtractType, que inclui as seguintes opções: Índice (0) - Extrair por número de página e ContainsText (1) - Extrair por texto correspondente.

    ExtractType
    Valor O valor correspondente ao tipo de extração.

    Por exemplo, se ExtractBy É índice, este seria o número da página como uma cadeia de caracteres; se ExtractBy ContainsText, este seria o texto a ser correspondido.

    Cadeia de caracteres
    Retornar Este método retorna uma DataTable que representa uma tabela extraída do arquivo PDF. Tabela

    Gettext

    Recupera texto do intervalo fornecido de páginas PDF.

    Chame este método com os números de página inicial e final para recuperar o texto dessas páginas. O método retorna o texto extraído como uma cadeia de caracteres.

    Tabela 12. Parâmetros do método gettext
    Parâmetro Descrição Tipo de dados
    Página O número da página inicial do intervalo do qual extrair o texto. Os números de página normalmente começam em 1. Int32
    Página O número da página para a qual você recupera o texto da página inicial.
    Nota:
    Certifique-se de que o valor ToPage seja maior que Página valor.
    Int32
    Retornar Este método retorna uma cadeia de caracteres que representa o conteúdo de texto do arquivo PDF. Cadeia de caracteres

    Carregar

    Carrega um arquivo PDF para interação, permitindo operações adicionais, como extrair conteúdo.

    Chame este método com o caminho completo para o arquivo PDF (FilePath) e, opcionalmente, forneça uma senha (Senha) se o PDF estiver protegido.

    Tabela 13. Parâmetros do método de carregamento
    Parâmetro Descrição Tipo de dados
    Caminho do arquivo O caminho completo para o arquivo PDF a ser carregado. Isso deve incluir o nome e a extensão do arquivo. Cadeia de caracteres
    Senha A senha do arquivo PDF, se ele estiver protegido. Se o PDF não for protegido por senha, este parâmetro pode ser uma cadeia de caracteres vazia. Cadeia de caracteres

    Mesclar

    Mescla uma lista de arquivos PDF em um único arquivo PDF.

    Chame este método com uma lista de caminhos de arquivo dos PDFs a serem mesclados, o caminho do arquivo de saída e um sinalizador de substituição opcional.

    Tabela 14. Parâmetros do Método de mesclagem
    Parâmetro Descrição Tipo de dados
    Lista de arquivos Uma lista de caminhos de arquivo para os arquivos PDF a serem mesclados. Cada caminho deve ser um caminho válido para um arquivo PDF. Lista de arrayList
    OutputFilePath O caminho do arquivo em que o PDF mesclado é salvo. Isso deve incluir o nome e a extensão do arquivo. Cadeia de caracteres
    Substituir Se definido como Verdadeiro , o método substitui o arquivo existente no caminho de saída, se ele existir. Se definido como Falso , o método não substitui o arquivo existente.

    O padrão é Falso .

    Booliano
    Nota:
    Se os arquivos PDF forem protegidos por senha ou estiverem em um formato incorreto no Lista de arquivos , a automação exibe um erro.

    Divisão

    Divide um único PDF em vários arquivos, onde cada página no PDF é salva como um arquivo separado.

    Chame este método com o caminho da pasta de saída onde as páginas PDF divididas devem ser salvas.

    Tabela 15. Parâmetro do método de divisão
    Parâmetro Descrição Tipo de dados
    OutputFolderPath O caminho para a pasta onde as páginas PDF divididas são salvas. Certifique-se de que a pasta exista ou tenha permissões apropriadas para gravar arquivos. Cadeia de caracteres