PDF 커넥터 메서드
에서 PDF 커넥터 RPA 데스크톱 디자인 스튜디오의 다양한 방법을 사용하여 문서 자동화를 위한 PDF 처리를 가속화합니다.
PDF 커넥터를 사용하기 위한 필수 구성 요소
다른 방법을 사용하기 전에 PDF 커넥터에서 로드 방법을 사용합니다. PDF 파일의 전체 경로(FilePath)를 사용하여 이 메서드를 호출하고 PDF가 보호된 경우 선택적으로 암호(암호)를 제공합니다.
닫기
PDF 문서와 연결된 자원을 닫습니다. 이 메서드를 사용하여 Load 메서드를 사용한 후 참조와 리소스를 릴리스합니다.
PDF 문서를 더 이상 사용할 필요가 없거나 PDF 문서로 작업을 완료한 후에 이 메서드를 호출합니다.
Excel로 변환
PDF 문서를 Excel 문서로 변환합니다 Microsoft . 선택적으로, 지정된 경우 테이블만 변환할 수 있습니다.
변환된 Excel 문서를 저장해야 하는 파일 경로로 이 메서드를 호출하고, 테이블만 변환해야 하는 경우 선택적으로 ConvertTablesOnly 를 True 로 설정합니다.
| 매개변수 | 설명 | 데이터 유형 |
|---|---|---|
| ExcelFilepath | 변환된 Excel 문서(.xlsx)가 저장되는 파일 경로입니다. 파일 경로에 파일 이름과 확장자가 포함되어 있는지 확인합니다. | 문자열 |
| ConvertTablesOnly | True로 설정하면 PDF 문서의 테이블만 Excel로 변환됩니다. 기본값은 True입니다. | 부울 |
HTML로 변환
PDF의 지정된 페이지를 HTML 형식으로 변환합니다. 페이지 번호가 0보다 작거나 같으면 PDF의 모든 페이지가 HTML로 변환됩니다.
HTML로 변환하려는 PDF의 페이지 번호를 사용하여 이 메서드를 호출합니다. 0보다 작거나 같은 페이지 번호를 전달하면 전체 PDF가 HTML로 변환됩니다. 메서드는 HTML 컨텐츠를 문자열로 반환합니다.
| 매개변수 | 설명 | 데이터 유형 |
|---|---|---|
| PageNumber(데이터 입력) | HTML로 변환할 PDF의 페이지 번호입니다. 이 매개변수가 0보다 작거나 같으면 PDF의 모든 페이지가 HTML로 변환됩니다. 페이지 번호는 일반적으로 1부터 시작합니다. | 정체32 |
| 반환(데이터 출력) | 이 메서드는 PDF 파일의 내용을 나타내는 문자열로 HTML 컨텐츠를 반환합니다. | 문자열 |
ConvertToImage
PDF 문서의 지정된 페이지를 이미지로 변환합니다. 필요에 따라 이미지가 저장되는 이미지 경로, DPI(인치당 도트 수) 및 이미지 품질을 지정합니다.
변환할 PDF의 페이지 번호, 이미지를 저장해야 하는 파일 경로를 사용하여 이 메서드를 호출하고 필요에 따라 DPI 및 이미지 품질 매개변수를 조정합니다.
| 매개변수 | 설명 | 데이터 유형 |
|---|---|---|
| PageNumber | 이미지로 변환할 PDF의 페이지 번호입니다. 페이지 번호는 일반적으로 1부터 시작합니다. | 정체32 |
| 이미지 경로 | 변환된 이미지가 저장되는 파일 경로입니다. 파일 경로에 파일 이름과 확장명이 포함되어 있는지 확인 | 문자열 |
| DPI | 생성된 이미지의 DPI(인치당 도트 수) 해상도입니다. 기본값은 200DPI입니다. | 정체32 |
| 품질 | 생성된 이미지의 품질 수준으로, 0(최저)에서 100(최고)까지의 범위입니다. 기본값은 95입니다. | 정체32 |
이미지로 변환
PDF 문서를 이미지로 변환합니다. 필요에 따라 이미지가 저장되는 폴더 경로, DPI(인치당 도트 수), 이미지 품질 및 생성된 파일 이름을 저장할 선택적 목록을 지정합니다.
이미지를 저장해야 하는 폴더 경로로 이 메서드를 호출합니다. 필요에 따라 DPI 및 이미지 품질 매개변수를 조정합니다. 목록을 FileNames 매개변수로 제공하면 생성된 이미지 파일의 이름으로 채워집니다.
| 매개변수 | 설명 | 데이터 유형 |
|---|---|---|
| 폴더 경로 | 변환된 이미지가 저장될 폴더 경로입니다. 폴더가 존재하고 적절한 쓰기 권한이 있는지 확인합니다. 예: /Users/Username/Documents/MyFolder |
문자열 |
| DPI | 생성된 이미지의 DPI(인치당 도트 수) 해상도입니다. 기본값은 200DPI입니다. | 정체32 |
| 품질 | 생성된 이미지의 품질 수준으로, 0(최저)에서 100(최고)까지의 범위입니다. 기본값은 95입니다. | 정체32 |
ConvertToWord
PDF를 Word 문서로 변환합니다 Microsoft .
변환된 Word 문서를 저장해야 하는 파일 경로를 사용하여 이 메서드를 호출합니다. 이 메서드는 지정된 경로에서 PDF 콘텐츠의 Word 문서를 만듭니다.
| 매개변수 | 설명 | 데이터 유형 |
|---|---|---|
| 워드 파일 경로 | 변환된 Word 문서(.doc)가 저장되는 파일 경로입니다. 파일 경로에 파일 이름과 확장자가 포함되어 있는지 확인합니다. | 문자열 |
ConvertToXml
PDF 문서의 지정된 페이지를 Microsoft XML 형식으로 변환합니다. 선택적으로, 지정된 경우 테이블만 변환할 수 있습니다.
변환할 PDF의 페이지 번호, XML 출력을 저장해야 하는 파일 경로와 함께 이 메서드를 호출하고, 테이블만 변환해야 하는 경우 선택적으로 ConvertTablesOnly 를 True 로 설정합니다.
| 매개변수 | 설명 | 데이터 유형 |
|---|---|---|
| PageNumber | XML 형식으로 변환할 PDF의 페이지 번호입니다. 페이지 번호는 일반적으로 1부터 시작합니다. | 정체32 |
| Xml파일 경로 | 변환된 XML 문서가 저장될 파일 경로입니다. 파일 경로에 파일 이름과 확장명이 포함되어 있는지 확인 | 문자열 |
| ConvertTablesOnly | 예로 설정하면 지정된 페이지의 테이블만 XML로 변환됩니다. 기본값은 True입니다. | 부울 |
이미지 추출
PDF 문서의 지정된 페이지에서 이미지를 추출합니다. 필요에 따라 이미지가 저장되는 폴더 경로와 생성된 파일 이름을 저장할 출력 목록을 지정합니다.
이미지를 저장해야 하는 폴더 경로, 이미지를 추출할 시작 및 종료 페이지 번호, 추출된 이미지의 파일 이름을 저장할 빈 목록을 사용하여 이 메서드를 호출합니다.
| 매개변수 | 설명 | 데이터 유형 |
|---|---|---|
| 폴더 경로 | 추출한 이미지가 저장되는 폴더 경로입니다. 폴더가 존재하고 적절한 쓰기 권한이 있는지 확인합니다. | 문자열 |
| 시작 페이지 | 이미지를 추출할 시작 페이지 번호입니다. 페이지 번호는 일반적으로 1부터 시작합니다. | 정체32 |
| 종료 페이지 | 이미지를 추출해야 하는 종료 페이지 번호입니다. 이 숫자는 FromPage 번호보다 크거나 같아야 합니다. | 정체32 |
| 파일 이름 | 추출된 이미지의 파일 이름을 저장하는 출력 매개변수입니다. | 목록'1 |
GetAllTables
PDF 문서에서 모든 테이블을 추출하여 DataTable 목록으로 반환합니다.
Return 매개변수를 사용하여 추출된 테이블 데이터를 목록으로 검색합니다.
매개변수 없이 이 메서드를 호출하여 PDF 문서에서 모든 테이블을 검색합니다. 이 메서드는 각 DataTable이 PDF에서 추출한 테이블을 나타내는 DataTable 목록을 반환합니다.
| 매개변수 | 설명 | 데이터 유형 |
|---|---|---|
| 돌아가기 | 이 메서드는 PDF 파일에서 추출한 테이블을 나타내는 DataTable 목록을 반환합니다. | 목록'1 |
GetPageAsImage
PDF 문서 페이지에서 데이터를 추출하여 메모리 내 이미지로 저장합니다.
PDF 문서의 지정된 페이지를 메모리 내 이미지로 반환합니다.
PDF의 페이지 번호를 사용하여 이 메서드를 호출하여 페이지를 이미지로 검색합니다. 메서드는 페이지를 System.Drawing.Image 개체로 반환합니다.
| 매개변수 | 설명 | 데이터 유형 |
|---|---|---|
| PageNumber | 이미지로 변환할 PDF의 페이지 번호입니다. 페이지 번호는 일반적으로 1부터 시작합니다. | 정체32 |
| 돌아가기 | 이 메서드는 PDF 파일의 지정된 페이지를 나타내는 이미지를 반환합니다. | 그리기.이미지 |
GetPageCount
PDF 문서의 총 페이지 수를 검색합니다. Return 매개변수를 사용하여 PDF의 총 페이지 수를 정수로 검색해야 합니다.
| 매개변수 | 설명 | 데이터 유형 |
|---|---|---|
| 돌아가기 | 이 메서드는 PDF 파일의 페이지 수를 나타내는 정수를 반환합니다. | 정체32 |
테이블 가져오기
PDF에서 테이블을 추출하여 DataTable로 반환합니다. 추출 방법은 ExtractBy 매개변수로 지정됩니다.
추출 유형과 해당 값을 사용하여 이 메서드를 호출합니다. 메서드는 추출된 테이블을 DataTable로 반환합니다.
| 매개변수 | 설명 | 데이터 유형 |
|---|---|---|
| 추출자 | 사용할 추출 방법입니다. 이 매개변수는 Index(0) - 페이지 번호로 추출 및 ContainsText(1) - 일치하는 텍스트로 추출 옵션을 포함하는 ExtractType이어야 합니다. |
추출 유형 |
| 값 | 추출 유형에 해당하는 값입니다. 예를 들어 ExtractBy 가 Index인 경우 문자열로 페이지 번호가 됩니다. ExtractBy 가 ContainsText이면 일치시킬 텍스트가 됩니다. |
문자열 |
| 돌아가기 | 이 메서드는 PDF 파일에서 추출한 테이블을 나타내는 DataTable을 반환합니다. | 테이블 |
텍스트 가져오기
지정된 PDF 페이지 범위에서 텍스트를 검색합니다.
시작 및 종료 페이지 번호와 함께 이 메서드를 호출하여 해당 페이지에서 텍스트를 검색합니다. 메서드는 추출된 텍스트를 문자열로 반환합니다.
| 매개변수 | 설명 | 데이터 유형 |
|---|---|---|
| 시작 페이지 | 텍스트를 추출할 범위의 시작 페이지 번호입니다. 페이지 번호는 일반적으로 1부터 시작합니다. | 정체32 |
| 종료 페이지 | 시작 페이지에서 텍스트를 검색할 페이지 번호입니다. 주: ToPage 값이 FromPage 값보다 큰지 확인합니다. |
정체32 |
| 돌아가기 | 이 메서드는 PDF 파일의 텍스트 내용을 나타내는 문자열을 반환합니다. | 문자열 |
로드
상호작용을 위해 PDF 파일을 로드하여 콘텐츠 추출과 같은 추가 작업을 활성화합니다.
PDF 파일의 전체 경로(FilePath)를 사용하여 이 메서드를 호출하고 PDF가 보호된 경우 선택적으로 암호(암호)를 제공합니다.
| 매개변수 | 설명 | 데이터 유형 |
|---|---|---|
| 파일 경로 | 로드할 PDF 파일의 전체 경로입니다. 파일 이름과 확장명을 포함해야 합니다. | 문자열 |
| 암호 | PDF 파일이 보호되는 경우 PDF 파일의 암호입니다. PDF가 암호로 보호되지 않은 경우 이 매개변수는 빈 문자열일 수 있습니다. | 문자열 |
병합
PDF 파일 목록을 단일 PDF 파일로 병합합니다.
병합할 PDF의 파일 경로 목록, 출력 파일 경로 및 선택적 덮어쓰기 플래그를 사용하여 이 메서드를 호출합니다.
| 매개변수 | 설명 | 데이터 유형 |
|---|---|---|
| 파일 목록 | 병합할 PDF 파일의 파일 경로 목록입니다. 각 경로는 PDF 파일의 유효한 경로여야 합니다. | 배열 목록 |
| 출력 파일 경로 | 병합된 PDF가 저장되는 파일 경로입니다. 파일 이름과 확장명을 포함해야 합니다. | 문자열 |
| 덮어쓰기 | True로 설정하면 메서드는 출력 경로에서 기존 파일이 있는 경우 파일을 덮어씁니다. False로 설정하면 메서드가 기존 파일을 덮어쓰지 않습니다. 기본값은 거짓입니다. |
부울 |
분할
단일 PDF를 여러 파일로 분할하면 PDF의 각 페이지가 별도의 파일로 저장됩니다.
분할된 PDF 페이지를 저장해야 하는 출력 폴더 경로로 이 메서드를 호출합니다.
| 매개변수 | 설명 | 데이터 유형 |
|---|---|---|
| 출력 폴더 경로 | 분할된 PDF 페이지가 저장되는 폴더의 경로입니다. 폴더가 있거나 파일 쓰기에 적합한 권한이 있는지 확인합니다. | 문자열 |