Métodos do conector de PDF
Acelere o processamento de PDF para a automação de documentos usando os vários métodos do conector de PDF no Design studio de RPA para desktop.
Pré-requisitos para usar o Conector de PDF
Use o Método Carregar no Conector PDF antes de usar os outros métodos. Chame este método com o caminho completo para o arquivo PDF (FilePath) e, opcionalmente, forneça uma senha (Senha) se o PDF estiver protegido.
Fechar
Fecha os recursos associados ao documento PDF. Use este método para liberar referências e recursos depois de usar o método Carregar.
Chame este método quando você não precisar mais usar o documento PDF ou depois de concluir operações com ele.
Convertpara Excel
Converte um documento PDF em Microsoft Documento do Excel. Se especificado, somente tabelas podem ser convertidas.
Chame este método com o caminho do arquivo onde o documento do Excel convertido deve ser salvo e opcionalmente definido ConvertTablesOnly para Verdadeiro se somente as tabelas precisarem ser convertidas.
| Parâmetro | Descrição | Tipo de dados |
|---|---|---|
| ExcelFilePath | O caminho do arquivo em que o documento do Excel convertido (.xlsx) é salvo. Certifique-se de que o caminho do arquivo inclua o nome e a extensão do arquivo. | Cadeia de caracteres |
| ConvertTablesOnly | Se definido como Verdadeiro , Somente tabelas do documento PDF são convertidas em Excel. O padrão é Verdadeiro . | Booliano |
ConvertToHTML
Converte uma página especificada de um PDF para o formato HTML. Se o número da página for menor ou igual a 0, todas as páginas do PDF serão convertidas em HTML.
Chame este método com o número de página do PDF que você deseja converter em HTML. Se você passar um número de página menor ou igual a 0, todo o PDF será convertido em HTML. O método retorna o conteúdo HTML como uma cadeia de caracteres.
| Parâmetro | Descrição | Tipo de dados |
|---|---|---|
| Número de página (Dados em) | O número da página do PDF a ser convertido em HTML. Se este parâmetro for menor ou igual a 0, todas as páginas do PDF serão convertidas em HTML. Os números de página normalmente começam em 1. | Int32 |
| Retorno (saída de dados) | Este método retorna o conteúdo HTML como uma cadeia de caracteres, representando o conteúdo do arquivo PDF. | Cadeia de caracteres |
ConvertToImage
Converte uma página especificada de um documento PDF em uma imagem. Opcionalmente, especifique o caminho da imagem onde a imagem será salva, DPI (pontos por polegada) e a qualidade da imagem.
Chame este método com o número da página do PDF a ser convertido, o caminho do arquivo onde a imagem deve ser salva e, opcionalmente, ajuste os parâmetros de DPI e qualidade da imagem.
| Parâmetro | Descrição | Tipo de dados |
|---|---|---|
| PageNumber | O número da página do PDF a ser convertido em uma imagem. Os números de página normalmente começam em 1. | Int32 |
| Caminho da imagem | O caminho do arquivo em que a imagem convertida é salva. Certifique-se de que o caminho do arquivo inclua o nome e a extensão do arquivo | Cadeia de caracteres |
| Dpi | A resolução de DPI (pontos por polegada) da imagem gerada. O padrão é 200 DPI. | Int32 |
| Qualidade | O nível de qualidade da imagem gerada, variando de 0 (mais baixo) a 100 (mais alto). O padrão é 95. | Int32 |
ConvertToImagens
Converte um documento PDF em imagens. Opcionalmente, especifique o caminho da pasta onde as imagens são salvas, DPI (pontos por polegada), qualidade da imagem e uma lista opcional para armazenar os nomes dos arquivos gerados.
Chame este método com o caminho da pasta onde as imagens devem ser salvas. Como opção, ajuste os parâmetros de DPI e qualidade da imagem. Se você fornecer uma lista como Nomes de arquivo parâmetro, ele é preenchido com os nomes dos arquivos de imagem gerados.
| Parâmetro | Descrição | Tipo de dados |
|---|---|---|
| Caminho da pasta | O caminho da pasta onde as imagens convertidas serão salvas. Certifique-se de que a pasta exista e tenha permissões de gravação apropriadas. Por exemplo, /Usuários/Nome de usuário/Documentos/Minha pasta |
Cadeia de caracteres |
| Dpi | A resolução de DPI (pontos por polegada) das imagens geradas. O padrão é 200 DPI. | Int32 |
| Qualidade | O nível de qualidade das imagens geradas, variando de 0 (mais baixo) a 100 (mais alto). O padrão é 95. | Int32 |
ConvertToWord
Converte um PDF em Microsoft Documento do Word.
Chame este método com o caminho do arquivo onde o documento convertido do Word deve ser salvo. O método cria um documento do Word a partir do conteúdo PDF no caminho especificado.
| Parâmetro | Descrição | Tipo de dados |
|---|---|---|
| Caminho do WordFilePath | O caminho do arquivo onde o documento convertido do Word (.doc) é salvo. Certifique-se de que o caminho do arquivo inclua o nome e a extensão do arquivo. | Cadeia de caracteres |
ConvertToXml
Converte uma página especificada de um documento PDF para o formato Microsoft XML. Se especificado, somente tabelas podem ser convertidas.
Chame este método com o número da página do PDF a ser convertido, o caminho do arquivo onde a saída XML deve ser salva e opcionalmente definida ConvertTablesOnly para Verdadeiro se somente as tabelas precisarem ser convertidas.
| Parâmetro | Descrição | Tipo de dados |
|---|---|---|
| PageNumber | O número da página do PDF a ser convertido para o formato XML. Os números de página normalmente começam em 1. | Int32 |
| XmlFilePath | O caminho do arquivo onde o documento XML convertido será salvo. Certifique-se de que o caminho do arquivo inclua o nome e a extensão do arquivo | Cadeia de caracteres |
| ConvertTablesOnly | Se definido como verdadeiro, somente as tabelas da página especificada serão convertidas em XML. O padrão é verdadeiro. | Booliano |
ExtractImages
Extrai imagens de páginas especificadas de um documento PDF. Como opção, especifique o caminho da pasta onde as imagens são salvas e uma lista de saída para armazenar os nomes dos arquivos gerados.
Chame este método com o caminho da pasta onde as imagens devem ser salvas, os números de página inicial e final da qual extrair imagens e uma lista vazia para armazenar os nomes de arquivo das imagens extraídas.
| Parâmetro | Descrição | Tipo de dados |
|---|---|---|
| Caminho da pasta | O caminho da pasta onde as imagens extraídas são salvas. Certifique-se de que a pasta exista e tenha permissões de gravação apropriadas. | Cadeia de caracteres |
| Página | O número da página inicial da qual extrair as imagens. Os números de página normalmente começam em 1. | Int32 |
| Página | O número da página final até o qual as imagens devem ser extraídas. Este número deve ser maior ou igual a Página número. | Int32 |
| Nomes de arquivo | Um parâmetro de saída que armazena os nomes de arquivo das imagens extraídas. | Lista'1 |
GetAllTables
Extrai todas as tabelas de um documento PDF e as retorna como uma lista de Tabelas de dados.
Use o. Retorno parâmetro para recuperar os dados da tabela extraídos como uma lista.
Chame este método sem parâmetros para recuperar todas as tabelas do documento PDF. O método retorna uma lista de DataTables, em que cada DataTable representa uma tabela extraída do PDF.
| Parâmetro | Descrição | Tipo de dados |
|---|---|---|
| Retornar | Este método retorna a lista de DataTable que representa tabelas extraídas do arquivo PDF. | Lista'1 |
Obter PageAsImage
Extrai dados de uma página de documento PDF e armazena-os como uma imagem na memória.
Retorna uma página especificada de um documento PDF como uma imagem na memória.
Chame este método com o número de página do PDF para recuperar a página como uma imagem. O método retorna a página como um objeto System.Drawing.Image.
| Parâmetro | Descrição | Tipo de dados |
|---|---|---|
| PageNumber | O número da página do PDF a ser convertido em uma imagem. Os números de página normalmente começam em 1. | Int32 |
| Retornar | Este método retorna uma imagem que representa uma página especificada do arquivo PDF. | Imagem.Desenho |
GetPageCount
Recupera o número total de páginas em um documento PDF. Você deve usar o. Retorno Parâmetro para recuperar a contagem total de páginas no PDF como um número inteiro.
| Parâmetro | Descrição | Tipo de dados |
|---|---|---|
| Retornar | Este método retorna um número inteiro que representa a contagem de páginas do arquivo PDF. | Int32 |
Obter tabela
Extrai uma tabela de um PDF e a retorna como uma DataTable. O método de extração é especificado pelo ExtractBy parâmetro.
Chame este método com o tipo de extração e o valor correspondente. O método retorna a tabela extraída como uma DataTable.
| Parâmetro | Descrição | Tipo de dados |
|---|---|---|
| ExtractBy | O método de extração a ser usado. Este parâmetro deve ser ExtractType, que inclui as seguintes opções: Índice (0) - Extrair por número de página e ContainsText (1) - Extrair por texto correspondente. |
ExtractType |
| Valor | O valor correspondente ao tipo de extração. Por exemplo, se ExtractBy É índice, este seria o número da página como uma cadeia de caracteres; se ExtractBy ContainsText, este seria o texto a ser correspondido. |
Cadeia de caracteres |
| Retornar | Este método retorna uma DataTable que representa uma tabela extraída do arquivo PDF. | Tabela |
Gettext
Recupera texto do intervalo fornecido de páginas PDF.
Chame este método com os números de página inicial e final para recuperar o texto dessas páginas. O método retorna o texto extraído como uma cadeia de caracteres.
| Parâmetro | Descrição | Tipo de dados |
|---|---|---|
| Página | O número da página inicial do intervalo do qual extrair o texto. Os números de página normalmente começam em 1. | Int32 |
| Página | O número da página para a qual você recupera o texto da página inicial. Nota: Certifique-se de que o valor ToPage seja maior que Página valor. |
Int32 |
| Retornar | Este método retorna uma cadeia de caracteres que representa o conteúdo de texto do arquivo PDF. | Cadeia de caracteres |
Carregar
Carrega um arquivo PDF para interação, permitindo operações adicionais, como extrair conteúdo.
Chame este método com o caminho completo para o arquivo PDF (FilePath) e, opcionalmente, forneça uma senha (Senha) se o PDF estiver protegido.
| Parâmetro | Descrição | Tipo de dados |
|---|---|---|
| Caminho do arquivo | O caminho completo para o arquivo PDF a ser carregado. Isso deve incluir o nome e a extensão do arquivo. | Cadeia de caracteres |
| Senha | A senha do arquivo PDF, se ele estiver protegido. Se o PDF não for protegido por senha, este parâmetro pode ser uma cadeia de caracteres vazia. | Cadeia de caracteres |
Mesclar
Mescla uma lista de arquivos PDF em um único arquivo PDF.
Chame este método com uma lista de caminhos de arquivo dos PDFs a serem mesclados, o caminho do arquivo de saída e um sinalizador de substituição opcional.
| Parâmetro | Descrição | Tipo de dados |
|---|---|---|
| Lista de arquivos | Uma lista de caminhos de arquivo para os arquivos PDF a serem mesclados. Cada caminho deve ser um caminho válido para um arquivo PDF. | Lista de arrayList |
| OutputFilePath | O caminho do arquivo em que o PDF mesclado é salvo. Isso deve incluir o nome e a extensão do arquivo. | Cadeia de caracteres |
| Substituir | Se definido como Verdadeiro , o método substitui o arquivo existente no caminho de saída, se ele existir. Se definido como Falso , o método não substitui o arquivo existente. O padrão é Falso . |
Booliano |
Divisão
Divide um único PDF em vários arquivos, onde cada página no PDF é salva como um arquivo separado.
Chame este método com o caminho da pasta de saída onde as páginas PDF divididas devem ser salvas.
| Parâmetro | Descrição | Tipo de dados |
|---|---|---|
| OutputFolderPath | O caminho para a pasta onde as páginas PDF divididas são salvas. Certifique-se de que a pasta exista ou tenha permissões apropriadas para gravar arquivos. | Cadeia de caracteres |