OCR 텍스트 구성요소 사용

릴리스 버전: Australia

업데이트 날짜 2026년 03월 12일

소요 시간: 2분

의 OCR(광학 문자 인식) 텍스트 구성 요소를 RPA 데스크톱 디자인 스튜디오사용하여 이미지에서 텍스트를 추출합니다.

시작하기 전에

필요한 역할: 없음

이 태스크 정보

중요사항:

릴리스 RPA 데스크톱 디자인 스튜디오 부터 Yokohama 최신 버전의 Tesseract OCR 엔진을 활용합니다. 이 업데이트는 이미지 전처리 및 성능 최적화를 개선합니다. OCR 텍스트 구성요소가 포함된 이전 자동화를 업데이트할 때 출력에 약간의 차이가 있을 수 있습니다. 따라서 업데이트 후 자동화를 확인하는 것이 중요합니다.

OCR 텍스트 구성 요소의 많은 속성은 다른 작업 UI 구성 요소와 공통적이며, 이러한 속성을 구성하려면 단원을 참조하십시오 작업의 속성(UI) 구성요소.

OCR 텍스트 구성 요소에 고유한 속성이 제공됩니다.

표 1. OCR 텍스트 구성요소 속성
속성	텍스트
이미지 소스	구성요소가 이미지를 가져오는 소스입니다.

프로시저

도구 상자 창에서 작업(UI) > OCR 텍스트.
OCR 텍스트 구성 요소를 디자인 화면으로 끌어옵니다.
옵션: 설정을 구성하려면 구성요소 설정 아이콘( )을 클릭합니다.
구성요소에는 검토하고 사용할 수 있는 기본 설정이 있습니다.

옵션: 다음 표에 설명된 대로 설정을 구성합니다.

표 2. OCR 설정
필드	설명
엔진	OCR 필드를 추출하는 데 사용되는 엔진 이름입니다.
언어	여러 언어를 지원할 수 있는 Teseract 엔진입니다. 사용자는 여기에 나열된 언어를 선택할 수 있습니다.
라인 높이 허용 오차	글꼴 줄 높이입니다.
변경 DPI	DPI 속성에 언급된 대로 이미지의 DPI(인치당 도트 수)를 변경합니다.
DPI	DPI 값입니다.
단어 추출	Word 형식으로 추출되는 텍스트입니다. 그렇지 않으면 일반 텍스트입니다.
반전	반전된 이미지 색상입니다. 예를 들어 검은색을 흰색으로 반전시킵니다.
언어	추출에 사용되는 언어입니다.
이미지 비율 조정	지정된 숫자로 이미지 비율을 조정합니다.
임계치	임계값에 따라 제거된 그레이스케일 이미지 또는 노이즈에서 변환된 이미지입니다.
임계값	임계값입니다.
시간 제한	구성요소 작업이 시간 초과된 후 시간입니다.

OCR 설정 창을 닫으려면 확인을 클릭합니다.
입력을 구성하려면 다음 문서를 참조하십시오 포트 속성 구성.
출력을 구성하려면 다음 문서를 참조하십시오 출력 포트 속성 구성.

옵션: 다음 표에 설명된 대로 포트를 연결합니다.


포트 유형	포트 이름	데이터 유형	목적	메모
데이터 입력	이미지/파일 경로	비트맵/문자열	이미지 또는 이미지 경로를 가져옵니다.	입력은 속성의 이미지 소스옵션에서 선택한 옵션에 따라 달라집니다. 포트: 데이터 유형은 비트맵입니다. 파일 경로: 데이터 유형은 문자열입니다.
데이터 출력	텍스트	문자열	이미지에서 추출된 텍스트를 반환합니다.
데이터 출력	신뢰도	미혼	추출된 텍스트 정확도 수치를 반환합니다.

구성 요소를 테스트하려면 구성 요소 모음을 마우스 오른쪽 단추로 클릭한 다음 여기에서 실행을 클릭합니다.

이미지에서 텍스트를 추출하고 구성요소 표시와 함께 표시

이미지에서 텍스트를 추출하고 표시 구성요소와 함께 표시합니다.

OCR 텍스트 구성요소는 이미지에 대한 경로를 사용합니다. 이미지는 "servicenow" 텍스트로 구성되어 있습니다. 구성요소는 이미지에서 텍스트를 추출하고 문자열을 Show 구성요소에 전달합니다(Show 구성요소를 사용하려면 다음을 참조하십시오 구성요소 표시 사용). 표시 구성요소는 메시지 데이터 입력 포트를 통해 텍스트를 가져온 다음 창에 텍스트를 표시합니다.