PDF 커넥터 메서드
에서 RPA 데스크톱 디자인 스튜디오PDF 커넥터의 다양한 방법을 사용하여 문서 자동화를 위한 PDF 처리 가속화 .
PDF 커넥터를 사용하기 위한 필수 구성 요소
다른 방법을 사용하기 전에 PDF 커넥터에서 로드 방법을 사용합니다. PDF 파일의 전체 경로(FilePath)를 사용하여 이 메서드를 호출하고 PDF가 보호된 경우 선택적으로 암호(암호)를 제공합니다.
닫기
PDF 문서와 연결된 자원을 닫습니다. 이 메서드를 사용하여 Load 메서드를 사용한 후 참조 및 리소스를 해제합니다.
PDF 문서를 더 이상 사용할 필요가 없거나 PDF 문서로 작업을 완료한 후 이 메서드를 호출합니다.
엑셀로 변환
PDF 문서를 Excel 문서로 Microsoft 변환합니다. 선택적으로 지정된 경우 테이블만 변환할 수 있습니다.
변환된 Excel 문서를 저장해야 하는 파일 경로를 사용하여 이 메서드를 호출하고, 필요에 따라 테이블만 변환해야 하는 경우 ConvertTablesOnly 를 True 로 설정합니다.
| 매개변수 | 설명 | 데이터 유형 |
|---|---|---|
| Excel파일 경로 | 변환된 Excel 문서(.xlsx)가 저장되는 파일 경로입니다. 파일 경로에 파일 이름과 확장자가 포함되어 있는지 확인합니다. | 문자열 |
| ConvertTablesOnly | True로 설정하면 PDF 문서의 테이블만 Excel로 변환됩니다. 기본값은 True입니다. | 부울 |
HTML로 변환
PDF의 지정된 페이지를 HTML 형식으로 변환합니다. 페이지 번호가 0보다 작거나 같으면 PDF의 모든 페이지가 HTML로 변환됩니다.
HTML로 변환하려는 PDF의 페이지 번호를 사용하여 이 메서드를 호출합니다. 0보다 작거나 같은 페이지 번호를 전달하면 전체 PDF가 HTML로 변환됩니다. 이 메서드는 HTML 콘텐츠를 문자열로 반환합니다.
| 매개변수 | 설명 | 데이터 유형 |
|---|---|---|
| PageNumber(데이터 입력) | HTML로 변환할 PDF의 페이지 번호입니다. 이 매개 변수가 0보다 작거나 같으면 PDF의 모든 페이지가 HTML로 변환됩니다. 페이지 번호는 일반적으로 1부터 시작합니다. | 정수32 |
| 반환(데이터 출력) | 이 메서드는 HTML 컨텐츠를 PDF 파일의 컨텐츠를 나타내는 문자열로 반환합니다. | 문자열 |
이미지로 변환
PDF 문서의 지정된 페이지를 이미지로 변환합니다. 필요에 따라 이미지가 저장되는 이미지 경로, DPI(인치당 도트 수) 및 이미지 품질을 지정합니다.
변환할 PDF의 페이지 번호, 이미지를 저장해야 하는 파일 경로를 사용하여 이 메서드를 호출하고 필요에 따라 DPI 및 이미지 품질 매개 변수를 조정합니다.
| 매개변수 | 설명 | 데이터 유형 |
|---|---|---|
| 페이지 번호 | 이미지로 변환할 PDF의 페이지 번호입니다. 페이지 번호는 일반적으로 1부터 시작합니다. | 정수32 |
| 이미지 경로 | 변환된 이미지가 저장되는 파일 경로입니다. 파일 경로에 파일 이름과 확장자가 포함되어 있는지 확인 | 문자열 |
| dpi | 생성된 이미지의 DPI(인치당 도트 수) 해상도입니다. 기본값은 200DPI입니다. | 정수32 |
| 품질 | 생성된 이미지의 품질 수준은 0(최저)에서 100(최고)까지입니다. 기본값은 95입니다. | 정수32 |
이미지로 변환
PDF 문서를 이미지로 변환합니다. 선택적으로 이미지가 저장되는 폴더 경로, DPI(인치당 도트 수), 이미지 품질 및 생성된 파일 이름을 저장할 선택적 목록을 지정합니다.
이미지를 저장해야 하는 폴더 경로를 사용하여 이 메서드를 호출합니다. 필요에 따라 DPI 및 이미지 품질 매개변수를 조정합니다. 목록을 FileNames 매개 변수로 제공하면 생성된 이미지 파일의 이름으로 채워집니다.
| 매개변수 | 설명 | 데이터 유형 |
|---|---|---|
| 폴더 경로 | 변환된 이미지가 저장될 폴더 경로입니다. 폴더가 존재하고 적절한 쓰기 권한이 있는지 확인합니다. 예: /Users/Username/Documents/MyFolder |
문자열 |
| dpi | 생성된 이미지의 DPI(인치당 도트 수) 해상도입니다. 기본값은 200DPI입니다. | 정수32 |
| 품질 | 생성된 이미지의 품질 수준은 0(최저)에서 100(최고)까지입니다. 기본값은 95입니다. | 정수32 |
워드로 변환
PDF를 Microsoft Word 문서로 변환합니다.
변환된 Word 문서를 저장해야 하는 파일 경로를 사용하여 이 메서드를 호출합니다. 이 메서드는 지정된 경로의 PDF 콘텐츠에서 Word 문서를 만듭니다.
| 매개변수 | 설명 | 데이터 유형 |
|---|---|---|
| WordFile경로 | 변환된 Word 문서(.doc)가 저장되는 파일 경로입니다. 파일 경로에 파일 이름과 확장자가 포함되어 있는지 확인합니다. | 문자열 |
ConvertToXml
PDF 문서의 지정된 페이지를 Microsoft XML 형식으로 변환합니다. 선택적으로 지정된 경우 테이블만 변환할 수 있습니다.
변환할 PDF의 페이지 번호, XML 출력을 저장해야 하는 파일 경로를 사용하여 이 메서드를 호출하고, 필요에 따라 테이블만 변환해야 하는 경우 ConvertTablesOnly 를 True 로 설정합니다.
| 매개변수 | 설명 | 데이터 유형 |
|---|---|---|
| 페이지 번호 | XML 형식으로 변환할 PDF의 페이지 번호입니다. 페이지 번호는 일반적으로 1부터 시작합니다. | 정수32 |
| XmlFile경로 | 변환된 XML 문서가 저장될 파일 경로입니다. 파일 경로에 파일 이름과 확장자가 포함되어 있는지 확인 | 문자열 |
| ConvertTablesOnly | True로 설정하면 지정된 페이지의 테이블만 XML로 변환됩니다. 기본값은 True입니다. | 부울 |
이미지 추출
PDF 문서의 지정된 페이지에서 이미지를 추출합니다. 선택적으로 이미지가 저장되는 폴더 경로와 생성된 파일 이름을 저장할 출력 목록을 지정합니다.
이미지를 저장해야 하는 폴더 경로, 이미지를 추출할 시작 및 종료 페이지 번호, 추출한 이미지의 파일 이름을 저장할 빈 목록을 사용하여 이 메서드를 호출합니다.
| 매개변수 | 설명 | 데이터 유형 |
|---|---|---|
| 폴더 경로 | 추출한 이미지가 저장되는 폴더 경로입니다. 폴더가 존재하고 적절한 쓰기 권한이 있는지 확인합니다. | 문자열 |
| FromPage | 이미지를 추출할 시작 페이지 번호입니다. 페이지 번호는 일반적으로 1부터 시작합니다. | 정수32 |
| 끝페이지 | 이미지를 추출해야 하는 끝 페이지 번호입니다. 이 숫자는 FromPage 숫자보다 크거나 같아야 합니다. | 정수32 |
| 파일 | 추출된 이미지의 파일 이름을 저장하는 출력 매개변수입니다. | 목록'1 |
GetAll테이블
PDF 문서에서 모든 테이블을 추출하여 DataTable 목록으로 반환합니다.
Return 매개변수를 사용하여 추출된 테이블 데이터를 목록으로 검색합니다.
매개변수 없이 이 메서드를 호출하여 PDF 문서에서 모든 테이블을 검색합니다. 이 메서드는 DataTable 목록을 반환하며, 여기서 각 DataTable은 PDF에서 추출한 테이블을 나타냅니다.
| 매개변수 | 설명 | 데이터 유형 |
|---|---|---|
| 돌아가기 | 이 메서드는 PDF 파일에서 추출한 테이블을 나타내는 DataTable 목록을 반환합니다. | 목록'1 |
GetPageAsImage
PDF 문서 페이지에서 데이터를 추출하여 메모리 내 이미지로 저장합니다.
PDF 문서의 지정된 페이지를 메모리 내 이미지로 반환합니다.
PDF의 페이지 번호와 함께 이 메서드를 호출하여 페이지를 이미지로 검색합니다. 이 메서드는 페이지를 System.Drawing.Image 개체로 반환합니다.
| 매개변수 | 설명 | 데이터 유형 |
|---|---|---|
| 페이지 번호 | 이미지로 변환할 PDF의 페이지 번호입니다. 페이지 번호는 일반적으로 1부터 시작합니다. | 정수32 |
| 돌아가기 | 이 메서드는 PDF 파일의 지정된 페이지를 나타내는 이미지를 반환합니다. | 그리기.이미지 |
GetPageCount
PDF 문서의 총 페이지 수를 검색합니다. PDF의 총 페이지 수를 정수로 검색하려면 Return 매개 변수를 사용해야 합니다.
| 매개변수 | 설명 | 데이터 유형 |
|---|---|---|
| 돌아가기 | 이 메서드는 PDF 파일의 페이지 수를 나타내는 정수를 반환합니다. | 정수32 |
테이블 가져오기
PDF에서 테이블을 추출하여 DataTable로 반환합니다. 추출 방법은 ExtractBy 매개 변수로 지정됩니다.
추출 유형 및 해당 값을 사용하여 이 메서드를 호출합니다. 이 메서드는 추출된 테이블을 DataTable로 반환합니다.
| 매개변수 | 설명 | 데이터 유형 |
|---|---|---|
| 추출 기준 | 사용할 추출 방법입니다. 이 매개 변수는 Index(0) - 페이지 번호로 추출하고 ContainsText(1) - 일치하는 텍스트를 사용하여 추출하는 옵션을 포함하는 ExtractType이어야 합니다. |
추출 유형 |
| 값 | 추출 유형에 해당하는 값입니다. 예를 들어 ExtractBy 가 인덱스인 경우 문자열로 된 페이지 번호가 됩니다. ExtractBy 가 ContainsText인 경우 이 텍스트는 일치시킬 텍스트입니다. |
문자열 |
| 돌아가기 | 이 메서드는 PDF 파일에서 추출한 테이블을 나타내는 DataTable을 반환합니다. | 테이블 |
텍스트 가져오기
지정된 PDF 페이지 범위에서 텍스트를 검색합니다.
시작 및 종료 페이지 번호와 함께 이 메서드를 호출하여 해당 페이지에서 텍스트를 검색합니다. 이 메서드는 추출된 텍스트를 문자열로 반환합니다.
| 매개변수 | 설명 | 데이터 유형 |
|---|---|---|
| FromPage | 텍스트를 추출할 범위의 시작 페이지 번호입니다. 페이지 번호는 일반적으로 1부터 시작합니다. | 정수32 |
| 끝페이지 | 시작 페이지에서 텍스트를 검색할 페이지 번호입니다. 주: ToPage 값이 FromPage 값보다 큰지 확인합니다. |
정수32 |
| 돌아가기 | 이 메서드는 PDF 파일의 텍스트 내용을 나타내는 문자열을 반환합니다. | 문자열 |
로드
상호작용을 위해 PDF 파일을 로드하여 컨텐츠 추출과 같은 추가 작업을 가능하게 합니다.
PDF 파일의 전체 경로(FilePath)를 사용하여 이 메서드를 호출하고 PDF가 보호된 경우 선택적으로 암호(암호)를 제공합니다.
| 매개변수 | 설명 | 데이터 유형 |
|---|---|---|
| FilePath | 로드할 PDF 파일의 전체 경로입니다. 여기에는 파일 이름과 확장자가 포함되어야 합니다. | 문자열 |
| 암호 | PDF 파일이 보호되어 있는 경우 해당 파일의 암호입니다. PDF가 암호로 보호되지 않은 경우 이 매개 변수는 빈 문자열일 수 있습니다. | 문자열 |
병합
PDF 파일 목록을 단일 PDF 파일로 병합합니다.
병합할 PDF의 파일 경로 목록, 출력 파일 경로 및 선택적 덮어쓰기 플래그를 사용하여 이 메서드를 호출합니다.
| 매개변수 | 설명 | 데이터 유형 |
|---|---|---|
| 파일 목록 | 병합할 PDF 파일의 파일 경로 목록입니다. 각 경로는 PDF 파일에 대한 올바른 경로여야 합니다. | 배열 목록 |
| 출력 파일 경로 | 병합된 PDF가 저장되는 파일 경로입니다. 여기에는 파일 이름과 확장자가 포함되어야 합니다. | 문자열 |
| 덮어쓰기 | True로 설정하면 메서드는 출력 경로에 있는 기존 파일이 있는 경우 해당 파일을 덮어씁니다. False로 설정하면 메서드가 기존 파일을 덮어쓰지 않습니다. 기본값은 거짓입니다. |
부울 |
분할
단일 PDF를 여러 파일로 분할하여 PDF의 각 페이지가 별도의 파일로 저장됩니다.
분할된 PDF 페이지를 저장해야 하는 출력 폴더 경로와 함께 이 메서드를 호출합니다.
| 매개변수 | 설명 | 데이터 유형 |
|---|---|---|
| OutputFolderPath | 분할된 PDF 페이지가 저장되는 폴더의 경로입니다. 폴더에 파일이 있거나 파일 쓰기에 적합한 권한이 있는지 확인합니다. | 문자열 |