PDF 커넥터 방법

  • 릴리스 버전: Washingtondc
  • 업데이트 날짜 2024년 02월 01일
  • 읽기5분
  • 에서 다양한 PDF 커넥터 방법을 사용하여 문서 자동화를 위한 PDF 처리를 RPA 데스크톱 디자인 스튜디오가속화합니다.

    로드

    PDF 파일을 자동화에 로드합니다. 다른 PDF 방법을 사용하기 전에 이 방법을 사용하여 PDF 파일을 자동화에 로드합니다.

    FilePath 매개변수를 사용하여 PDF 파일의 경로를 입력합니다. 이 필드는 이 메서드를 실행하는 데 필요합니다.

    단어로 변환

    PDF를 Word 문서로 변환합니다 Microsoft . 변환 Microsoft 된 Word 파일의 출력 파일 경로를 설정하는 WordFilePath 매개 변수를 사용해야 합니다.

    Excel로 변환

    PDF 문서를 Excel 문서로 변환합니다 Microsoft . 변환 Microsoft 된 Excel 파일의 출력 파일 경로를 설정하려면 ExcelFilePath 매개변수를 사용해야 합니다.

    HTML로 변환

    PDF 문서를 HTML 문서로 변환합니다.

    표 1. ConvertToHTML 메서드의 매개 변수
    매개변수 설명 필수 여부
    페이지 번호 HTML 페이지로 변환되는 PDF 문서의 페이지 번호입니다.
    UseSameFontSize (동일 글꼴 크기 사용) HTML 형식으로 변환하려면 동일한 글꼴 크기를 사용해야 하는지 여부를 확인합니다. 기본값은 false로 설정됩니다. 아니요

    이미지로 변환

    PDF 문서를 XML 문서로 변환합니다.

    표 2. ConvertToImage 메서드의 매개 변수
    매개변수 설명 필수 여부
    폴더 경로 구성요소가 이전에 실행한 구성요소의 이미지로 PDF를 저장하는 폴더의 경로를 가져옵니다.
    Dpi 이전에 실행된 구성요소에서 인치당 도트 수(DPI) 값을 가져옵니다. 아니요
    품질 이전에 실행된 구성요소에서 이미지의 품질을 나타내는 값을 가져옵니다. 아니요
    파일 이름 저장된 이미지의 경로와 이름을 반환하고 다음 구성요소로 전달합니다.

    소스 PDF에 여러 페이지가 포함되어 있는 경우 구성 요소는 각 페이지에 대한 이미지를 만듭니다.

    이미지로 변환

    PDF 문서의 페이지를 이미지로 변환합니다.

    표 3. ConvertToImages 메서드의 매개 변수
    매개변수 설명 필수입니까?
    Imagepath 구성요소가 이전에 실행한 구성요소의 이미지를 저장하는 로컬 드라이브의 위치로 경로를 가져옵니다.
    페이지 번호 이전에 실행된 구성요소에서 PDF 파일의 페이지 번호를 가져옵니다. 아니요
    Dpi 이전에 실행된 구성 요소에서 인치당 도트 수(DPI)를 가져옵니다. 값이 높을수록 저장된 이미지의 품질이 좋아집니다. 아니요
    품질 이전에 실행된 구성요소에서 이미지의 품질을 나타내는 값을 취합니다. 값이 높을수록 저장된 이미지의 품질이 좋아집니다. 아니요

    ConvertToTables (영문)

    PDF 문서의 내용을 표 형식으로 변환합니다. Return 매개변수를 사용하여 제목 및 열과 같은 표 형식 요소로 구성된 PDF 파일의 데이터를 검색합니다.

    Xml로 변환

    PDF 문서를 XML 문서로 변환합니다.

    표 4. ConvertToXml 메서드의 매개 변수
    매개변수 설명 필수입니까?
    XmlFilePath 이전에 실행된 구성요소에서 XML 파일의 대상 경로를 가져옵니다.
    ConvertTablesOnly(영문) 구성요소가 PDF 문서의 테이블만 변환하는지 여부를 나타내는 부울 값을 사용합니다. 아니요
    페이지 번호 PDF 문서의 페이지 번호를 가져와 페이지를 이전에 실행된 구성요소에서 XML 문서로 변환합니다. 아니요

    이미지 추출

    하나 이상의 PDF 문서 페이지를 이미지로 추출하여 저장합니다.

    표 5. ExtractImages 메서드의 매개 변수
    매개변수 설명 필수입니까?
    폴더 경로 추출된 이미지가 이전에 실행된 구성요소에서 저장될 대상 경로를 가져옵니다.
    페이지 번호 PDF 문서의 페이지 번호를 가져와 이전에 실행한 구성요소에서만 해당 페이지를 추출합니다. 아니요. 포트 연결은 선택 사항입니다.
    파일 추출된 이미지의 경로와 이름을 반환하고 다음 구성요소로 전달합니다.

    GetAllTables (영문)

    PDF 문서의 모든 표 형식 데이터를 목록으로 검색합니다. Return 매개변수를 사용하여 추출된 테이블 데이터를 목록으로 검색합니다.

    GetPageAsImage

    PDF 문서 페이지에서 데이터를 추출하여 메모리 내 이미지로 저장합니다.

    표 6. GetPageAsImage 메서드의 매개 변수
    매개변수 설명 필수입니까?
    페이지 번호 PDF 문서의 페이지 번호를 가져와 이전에 실행한 구성요소에서만 해당 페이지를 추출합니다. 아니요. 포트 연결은 선택 사항입니다.
    다시 이동 메모리 내 이미지를 비트맵으로 반환하고 다음 구성 요소로 전달합니다.

    GetPageCount (영문)

    PDF 문서의 총 페이지 수를 검색합니다. PDF의 총 페이지 수를 정수로 검색하려면 Return 매개 변수를 사용해야 합니다.

    Gettable

    PDF 문서에서 모든 테이블을 추출하고 테이블 형식 데이터를 데이터 테이블로 반환합니다.

    표 7. GetTable 메서드의 매개 변수
    매개변수 설명 필수입니까?
    추출 기준 이전에 실행한 구성요소에서 PDF 문서로의 경로를 가져옵니다.
    테이블의 형식입니다. 예: string. 아니요
    다시 이동 테이블에 데이터 테이블을 반환합니다. 아니요

    Gettext

    PDF 문서에서 텍스트를 추출합니다.

    표 8. GetText 메서드의 매개 변수
    매개변수 설명 필수입니까?
    FromPage(페이지)에서 텍스트 검색을 시작할 페이지 번호입니다. 페이지 범위 사이의 텍스트를 검색하려면 이 옵션을 사용합니다. 기본값은 0입니다. 아니요
    ToPage 시작 페이지에서 텍스트를 검색할 페이지 번호입니다.
    주:
    ToPage 값이 FromPage 값보다 높은지 확인합니다.
    아니요
    다시 이동 추출한 텍스트를 문자열로 반환하고 다음 구성요소로 전달합니다.

    로드

    PDF 파일을 자동화에 로드합니다. 다른 PDF 방법을 사용하기 전에 이 방법을 사용하여 PDF 파일을 자동화에 로드합니다.

    표 9. Load 방법의 매개 변수
    매개변수 설명 필수입니까?
    FilePath PDF 파일의 경로
    암호 암호로 보호되어 있는 경우 문서의 암호입니다. 아니요

    병합

    여러 PDF 파일을 결합합니다.
    표 10. 병합 방법의 매개 변수
    매개변수 설명 필수입니까?
    파일 목록 병합할 PDF 파일 목록입니다. 파일은 배열 형식으로 나열되어야 합니다.
    출력 파일 경로 PDF 파일의 병합된 출력을 생성할 경로입니다.
    덮어쓰기 파일 이름이 OutputFilePath 매개 변수에 지정된 것과 같은 경우 출력 디렉터리의 파일을 덮어씁니다. 기본값은 No로 설정되어 있습니다. 아니요
    주:
    PDF 파일이 암호로 보호되어 있거나 FileList 매개 변수에서 잘못된 형식인 경우 자동화에 오류가 표시됩니다.

    분할

    단일 PDF 파일을 여러 PDF 파일로 분할합니다. PDF 파일의 각 페이지는 별도의 PDF로 생성됩니다. OutputFolderPath 매개 변수를 사용하여 파일을 생성할 경로를 지정합니다.

    닫기

    Load 메서드를 사용하여 자동화에 로드하는 PDF 파일의 참조를 닫습니다.