Métodos do conector de PDF

Pré-requisitos para usar o Conector de PDF

Use o Método Carregar no Conector PDF antes de usar os outros métodos. Chame este método com o caminho completo para o arquivo PDF (FilePath) e, opcionalmente, forneça uma senha (Senha) se o PDF estiver protegido.

Fechar

Fecha os recursos associados ao documento PDF. Use este método para liberar referências e recursos depois de usar o método Carregar.

Chame este método quando você não precisar mais usar o documento PDF ou depois de concluir operações com ele.

Convertpara Excel

Converte um documento PDF em Microsoft Documento do Excel. Se especificado, somente tabelas podem ser convertidas.

Chame este método com o caminho do arquivo onde o documento do Excel convertido deve ser salvo e opcionalmente definido ConvertTablesOnly para Verdadeiro se somente as tabelas precisarem ser convertidas.

Tabela 1. Parâmetros do método ConvertToExcel
Parâmetro	Descrição	Tipo de dados
ExcelFilePath	O caminho do arquivo em que o documento do Excel convertido (.xlsx) é salvo. Certifique-se de que o caminho do arquivo inclua o nome e a extensão do arquivo.	Cadeia de caracteres
ConvertTablesOnly	Se definido como Verdadeiro , Somente tabelas do documento PDF são convertidas em Excel. O padrão é Verdadeiro .	Booliano

ConvertToHTML

Converte uma página especificada de um PDF para o formato HTML. Se o número da página for menor ou igual a 0, todas as páginas do PDF serão convertidas em HTML.

Chame este método com o número de página do PDF que você deseja converter em HTML. Se você passar um número de página menor ou igual a 0, todo o PDF será convertido em HTML. O método retorna o conteúdo HTML como uma cadeia de caracteres.

Tabela 2. Parâmetros do método ConvertToHTML
Parâmetro	Descrição	Tipo de dados
Número de página (Dados em)	O número da página do PDF a ser convertido em HTML. Se este parâmetro for menor ou igual a 0, todas as páginas do PDF serão convertidas em HTML. Os números de página normalmente começam em 1.	Int32
Retorno (saída de dados)	Este método retorna o conteúdo HTML como uma cadeia de caracteres, representando o conteúdo do arquivo PDF.	Cadeia de caracteres

ConvertToImage

Converte uma página especificada de um documento PDF em uma imagem. Opcionalmente, especifique o caminho da imagem onde a imagem será salva, DPI (pontos por polegada) e a qualidade da imagem.

Chame este método com o número da página do PDF a ser convertido, o caminho do arquivo onde a imagem deve ser salva e, opcionalmente, ajuste os parâmetros de DPI e qualidade da imagem.

Tabela 3. Parâmetros do método ConvertToImage
Parâmetro	Descrição	Tipo de dados
PageNumber	O número da página do PDF a ser convertido em uma imagem. Os números de página normalmente começam em 1.	Int32
Caminho da imagem	O caminho do arquivo em que a imagem convertida é salva. Certifique-se de que o caminho do arquivo inclua o nome e a extensão do arquivo	Cadeia de caracteres
Dpi	A resolução de DPI (pontos por polegada) da imagem gerada. O padrão é 200 DPI.	Int32
Qualidade	O nível de qualidade da imagem gerada, variando de 0 (mais baixo) a 100 (mais alto). O padrão é 95.	Int32

ConvertToImagens

Converte um documento PDF em imagens. Opcionalmente, especifique o caminho da pasta onde as imagens são salvas, DPI (pontos por polegada), qualidade da imagem e uma lista opcional para armazenar os nomes dos arquivos gerados.

Chame este método com o caminho da pasta onde as imagens devem ser salvas. Como opção, ajuste os parâmetros de DPI e qualidade da imagem. Se você fornecer uma lista como Nomes de arquivo parâmetro, ele é preenchido com os nomes dos arquivos de imagem gerados.

Tabela 4. Parâmetros do método ConvertToImages
Parâmetro	Descrição	Tipo de dados
Caminho da pasta	O caminho da pasta onde as imagens convertidas serão salvas. Certifique-se de que a pasta exista e tenha permissões de gravação apropriadas. Por exemplo, `/Usuários/Nome de usuário/Documentos/Minha pasta`	Cadeia de caracteres
Dpi	A resolução de DPI (pontos por polegada) das imagens geradas. O padrão é 200 DPI.	Int32
Qualidade	O nível de qualidade das imagens geradas, variando de 0 (mais baixo) a 100 (mais alto). O padrão é 95.	Int32

ConvertToWord

Converte um PDF em Microsoft Documento do Word.

Chame este método com o caminho do arquivo onde o documento convertido do Word deve ser salvo. O método cria um documento do Word a partir do conteúdo PDF no caminho especificado.

Tabela 5. Parâmetro do método ConvertToWord
Parâmetro	Descrição	Tipo de dados
Caminho do WordFilePath	O caminho do arquivo onde o documento convertido do Word (.doc) é salvo. Certifique-se de que o caminho do arquivo inclua o nome e a extensão do arquivo.	Cadeia de caracteres

ConvertToXml

Converte uma página especificada de um documento PDF para o formato Microsoft XML. Se especificado, somente tabelas podem ser convertidas.

Chame este método com o número da página do PDF a ser convertido, o caminho do arquivo onde a saída XML deve ser salva e opcionalmente definida ConvertTablesOnly para Verdadeiro se somente as tabelas precisarem ser convertidas.

Tabela 6. Parâmetros do método ConvertToXml
Parâmetro	Descrição	Tipo de dados
PageNumber	O número da página do PDF a ser convertido para o formato XML. Os números de página normalmente começam em 1.	Int32
XmlFilePath	O caminho do arquivo onde o documento XML convertido será salvo. Certifique-se de que o caminho do arquivo inclua o nome e a extensão do arquivo	Cadeia de caracteres
ConvertTablesOnly	Se definido como verdadeiro, somente as tabelas da página especificada serão convertidas em XML. O padrão é verdadeiro.	Booliano

ExtractImages

Extrai imagens de páginas especificadas de um documento PDF. Como opção, especifique o caminho da pasta onde as imagens são salvas e uma lista de saída para armazenar os nomes dos arquivos gerados.

Chame este método com o caminho da pasta onde as imagens devem ser salvas, os números de página inicial e final da qual extrair imagens e uma lista vazia para armazenar os nomes de arquivo das imagens extraídas.

Tabela 7. Parâmetros para o método ExtractImages
Parâmetro	Descrição	Tipo de dados
Caminho da pasta	O caminho da pasta onde as imagens extraídas são salvas. Certifique-se de que a pasta exista e tenha permissões de gravação apropriadas.	Cadeia de caracteres
Página	O número da página inicial da qual extrair as imagens. Os números de página normalmente começam em 1.	Int32
Página	O número da página final até o qual as imagens devem ser extraídas. Este número deve ser maior ou igual a Página número.	Int32
Nomes de arquivo	Um parâmetro de saída que armazena os nomes de arquivo das imagens extraídas.	Lista'1

GetAllTables

Extrai todas as tabelas de um documento PDF e as retorna como uma lista de Tabelas de dados.

Use o. Retorno parâmetro para recuperar os dados da tabela extraídos como uma lista.

Chame este método sem parâmetros para recuperar todas as tabelas do documento PDF. O método retorna uma lista de DataTables, em que cada DataTable representa uma tabela extraída do PDF.

Tabela 8. Parâmetro do método GetAllTables
Parâmetro	Descrição	Tipo de dados
Retornar	Este método retorna a lista de DataTable que representa tabelas extraídas do arquivo PDF.	Lista'1

Obter PageAsImage

Extrai dados de uma página de documento PDF e armazena-os como uma imagem na memória.

Retorna uma página especificada de um documento PDF como uma imagem na memória.

Chame este método com o número de página do PDF para recuperar a página como uma imagem. O método retorna a página como um objeto System.Drawing.Image.

Tabela 9. Parâmetros do método GetPageAsImage
Parâmetro	Descrição	Tipo de dados
PageNumber	O número da página do PDF a ser convertido em uma imagem. Os números de página normalmente começam em 1.	Int32
Retornar	Este método retorna uma imagem que representa uma página especificada do arquivo PDF.	Imagem.Desenho

GetPageCount

Recupera o número total de páginas em um documento PDF. Você deve usar o. Retorno Parâmetro para recuperar a contagem total de páginas no PDF como um número inteiro.

Tabela 10. Parâmetro do método GetPageCount
Parâmetro	Descrição	Tipo de dados
Retornar	Este método retorna um número inteiro que representa a contagem de páginas do arquivo PDF.	Int32

Obter tabela

Extrai uma tabela de um PDF e a retorna como uma DataTable. O método de extração é especificado pelo ExtractBy parâmetro.

Chame este método com o tipo de extração e o valor correspondente. O método retorna a tabela extraída como uma DataTable.

Tabela 11. Parâmetros do método GetTable
Parâmetro	Descrição	Tipo de dados
ExtractBy	O método de extração a ser usado. Este parâmetro deve ser ExtractType, que inclui as seguintes opções: Índice (0) - Extrair por número de página e ContainsText (1) - Extrair por texto correspondente.	ExtractType
Valor	O valor correspondente ao tipo de extração. Por exemplo, se ExtractBy É índice, este seria o número da página como uma cadeia de caracteres; se ExtractBy ContainsText, este seria o texto a ser correspondido.	Cadeia de caracteres
Retornar	Este método retorna uma DataTable que representa uma tabela extraída do arquivo PDF.	Tabela

Gettext

Recupera texto do intervalo fornecido de páginas PDF.

Chame este método com os números de página inicial e final para recuperar o texto dessas páginas. O método retorna o texto extraído como uma cadeia de caracteres.

Tabela 12. Parâmetros do método gettext
Parâmetro	Descrição	Tipo de dados
Página	O número da página inicial do intervalo do qual extrair o texto. Os números de página normalmente começam em 1.	Int32
Página	O número da página para a qual você recupera o texto da página inicial. Nota: Certifique-se de que o valor ToPage seja maior que Página valor.	Int32
Retornar	Este método retorna uma cadeia de caracteres que representa o conteúdo de texto do arquivo PDF.	Cadeia de caracteres

Carregar

Carrega um arquivo PDF para interação, permitindo operações adicionais, como extrair conteúdo.

Chame este método com o caminho completo para o arquivo PDF (FilePath) e, opcionalmente, forneça uma senha (Senha) se o PDF estiver protegido.

Tabela 13. Parâmetros do método de carregamento
Parâmetro	Descrição	Tipo de dados
Caminho do arquivo	O caminho completo para o arquivo PDF a ser carregado. Isso deve incluir o nome e a extensão do arquivo.	Cadeia de caracteres
Senha	A senha do arquivo PDF, se ele estiver protegido. Se o PDF não for protegido por senha, este parâmetro pode ser uma cadeia de caracteres vazia.	Cadeia de caracteres

Mesclar

Mescla uma lista de arquivos PDF em um único arquivo PDF.

Chame este método com uma lista de caminhos de arquivo dos PDFs a serem mesclados, o caminho do arquivo de saída e um sinalizador de substituição opcional.

Tabela 14. Parâmetros do Método de mesclagem
Parâmetro	Descrição	Tipo de dados
Lista de arquivos	Uma lista de caminhos de arquivo para os arquivos PDF a serem mesclados. Cada caminho deve ser um caminho válido para um arquivo PDF.	Lista de arrayList
OutputFilePath	O caminho do arquivo em que o PDF mesclado é salvo. Isso deve incluir o nome e a extensão do arquivo.	Cadeia de caracteres
Substituir	Se definido como Verdadeiro , o método substitui o arquivo existente no caminho de saída, se ele existir. Se definido como Falso , o método não substitui o arquivo existente. O padrão é Falso .	Booliano

Nota:

Se os arquivos PDF forem protegidos por senha ou estiverem em um formato incorreto no Lista de arquivos , a automação exibe um erro.

Divisão

Divide um único PDF em vários arquivos, onde cada página no PDF é salva como um arquivo separado.

Chame este método com o caminho da pasta de saída onde as páginas PDF divididas devem ser salvas.

Tabela 15. Parâmetro do método de divisão
Parâmetro	Descrição	Tipo de dados
OutputFolderPath	O caminho para a pasta onde as páginas PDF divididas são salvas. Certifique-se de que a pasta exista ou tenha permissões apropriadas para gravar arquivos.	Cadeia de caracteres