OCR 텍스트 구성요소 사용

  • 릴리스 버전: Xanadu
  • 업데이트 날짜 2024년 08월 01일
  • 소요 시간: 2분
  • 에서 RPA 데스크톱 디자인 스튜디오OCR 텍스트 구성 요소를 사용하여 이미지에서 텍스트를 추출합니다.

    시작하기 전에

    필요한 역할: 없음

    이 태스크 정보

    OCR 텍스트 구성 요소의 많은 속성은 다른 작업 UI 구성 요소와 공통적으로 사용되며, 이러한 속성을 구성하려면 을 참조하십시오 작업(UI) 구성요소의 속성.

    OCR 텍스트 구성 요소에 고유한 속성이 부여됩니다.
    표 1. OCR 텍스트 구성요소 속성
    속성 텍스트
    이미지 소스 구성요소가 이미지를 가져오는 소스입니다.

    프로시저

    1. 도구 상자 창에서 작업(UI) > OCR 텍스트.
    2. OCR 텍스트 구성 요소를 디자인 화면으로 드래그합니다.
    3. 옵션: 설정을 구성하려면 구성 요소 설정 아이콘( 구성 요소 설정 아이콘. )을 클릭합니다.
      구성요소에는 검토하고 사용할 수 있는 기본 설정이 있습니다.
    4. 옵션: 다음 표에 설명된 대로 설정을 구성합니다.
      표 2. OCR 설정
      필드 설명
      엔진 OCR 필드를 추출하는 데 사용되는 엔진 이름입니다.
      언어 여러 언어를 지원할 수 있는 Teseract 엔진입니다. 사용자는 여기에 나열된 언어를 선택할 수 있습니다.
      라인 높이 공차 글꼴 줄 높이입니다.
      DPI 변경 DPI 속성에 언급된 대로 이미지의 DPI(인치당 도트 수)를 변경합니다.
      DPI는 DPI 값입니다.
      단어 추출 단어 형식으로 추출된 텍스트입니다. 그렇지 않으면 일반 텍스트입니다.
      반전 반전된 이미지 색상입니다. 예를 들어 검은색을 흰색으로 반전시킵니다.
      언어 추출하는 데 사용되는 언어입니다.
      이미지 크기 조정 지정된 숫자로 이미지 배율을 조정합니다.
      임계치 회색 음영 이미지 또는 임계값에 따라 제거되는 노이즈에서 변환되는 이미지입니다.
      임계값 임계값입니다.
      시간 제한 구성요소 작업이 시간 초과될 때까지의 시간입니다.
    5. OCR 설정 창을 닫으려면 확인을 클릭합니다.
    6. 입력을 구성하려면 을 참조하십시오 포트 속성 구성.
    7. 출력을 구성하려면 을 참조하십시오 출력 포트 속성 구성.
    8. 옵션: 다음 표에 설명된 대로 포트를 연결합니다.
      포트 유형 포트 이름 데이터 유형 목적 필수? 참고 사항
      데이터 입력 이미지/파일 경로 비트맵/문자열 이미지 또는 이미지의 경로를 가져옵니다. 입력은 속성의 이미지 소스옵션에서 선택한 옵션에 따라 달라집니다.
      • 포트: 데이터 형식은 Bitmap입니다.
      • 파일 경로: 데이터 형식은 문자열입니다.
      데이터 출력 텍스트 문자열 이미지에서 추출한 텍스트를 반환합니다. 아니요. 이 포트를 연결하는 것은 선택 사항입니다.
      데이터 출력 신뢰도 단일 추출한 텍스트 정확도 수치를 반환합니다. 아니요. 이 포트를 연결하는 것은 선택 사항입니다.
    9. 구성 요소를 테스트하려면 구성 요소 모음을 마우스 오른쪽 단추로 클릭한 다음 Run From Here(여기에서 실행)를 클릭합니다.

    이미지에서 텍스트를 추출하고 Show 구성요소로 표시

    OCR 텍스트 구성 요소는 이미지의 경로를 사용합니다. 이미지는 "servicenow" 텍스트로 구성됩니다. 구성 요소는 이미지에서 텍스트를 추출하고 문자열을 Show 구성 요소에 전달합니다(Show 구성 요소를 사용하려면 참조 구성요소 표시 사용). Show 구성 요소는 Message Data In 포트를 통해 텍스트를 가져온 다음 창에 텍스트를 표시합니다.