Métodos do conector de PDF

  • Versão de lançamento: Washingtondc
  • Atualizado 1 de fev. de 2024
  • 5 min. de leitura
  • Acelere o processamento de PDF para automação de documentos usando os vários métodos do conector de PDF em Design studio de RPA para desktop.

    Carregar

    Carrega um arquivo PDF na automação. Use este método para carregar o arquivo PDF na automação antes de usar qualquer outro método de PDF.

    Use o parâmetro FilePath para inserir o caminho do arquivo PDF. Este campo é necessário para executar este método.

    Converter em palavra

    Converte um PDF em um Microsoft documento do Word. Você deve usar o parâmetro WordFilePath para definir o caminho do arquivo de saída para o arquivo do Word Microsoft convertido.

    Converter em Excel

    Converte um documento PDF em um Microsoft documento do Excel. Você deve usar o parâmetro ExcelFilePath para definir o caminho do arquivo de saída para o arquivo do Excel Microsoft convertido.

    Converter em HTML

    Converte um documento PDF em um documento HTML.

    Tabela 1. Parâmetros do método ConvertToHTML
    Parâmetro Descrição Obrigatório ou não
    Número da página Número da página do documento PDF que é convertido em uma página HTML. Sim
    UsarSameFontSize Verifica se o mesmo tamanho de fonte deve ser usado para converter para o formato HTML. O valor padrão é definido como falso. Não

    Converter em imagem

    Converte um documento PDF em um documento XML.

    Tabela 2. Parâmetros do método ConvertToImage
    Parâmetro Descrição Obrigatório ou não
    Caminho de pasta Usa o caminho para a pasta em que o componente salva o PDF como uma imagem de um componente executado anteriormente. Sim
    DPI Obtém o valor de Pontos por Polegada (DPI) de um componente executado anteriormente. Não
    Qualidade Obtém o valor que indica a qualidade da imagem de um componente executado anteriormente. Não
    Nomes de arquivos Retorna o caminho e o nome da imagem salva e passa para o próximo componente.

    Quando o PDF de origem inclui várias páginas, o componente cria imagens para cada página.

    Sim

    Converter em imagens

    Converte as páginas de um documento PDF em imagens.

    Tabela 3. Parâmetros do método ConvertToImages
    Parâmetro Descrição Obrigatório ou não?
    ImagePath Usa o caminho para o local na unidade local em que o componente salva as imagens de um componente executado anteriormente. Sim
    Número da página Obtém o número da página do arquivo PDF de um componente executado anteriormente. Não
    DPI Obtém os pontos por polegadas (DPI) de um componente executado anteriormente. Quanto maior o valor, melhor a qualidade das imagens salvas. Não
    Qualidade Obtém o valor que indica a qualidade das imagens de um componente executado anteriormente. Quanto maior o valor, melhor a qualidade das imagens salvas. Não

    Converter em Tabelas

    Converta o conteúdo de um documento PDF para o formato tabular. Use o parâmetro Retornar para recuperar os dados no arquivo PDF organizados em elementos tabulares, como título e colunas.

    ConvertToXml

    Converte um documento PDF em um documento XML.

    Tabela 4. Parâmetros do método ConvertToXml
    Parâmetro Descrição Obrigatório ou não?
    XmlFilePath Usa o caminho de destino do arquivo XML de um componente executado anteriormente. Sim
    ConvertTablesOnly Usa o valor booliano para indicar se o componente converte somente as tabelas no documento PDF. Não
    Número da página Usa o número da página do documento PDF para converter a página em um documento XML a partir de um componente executado anteriormente. Não

    Extrair imagens

    Extrai uma ou mais páginas de documento PDF como imagens e as salva.

    Tabela 5. Parâmetros para o método ExtrairImagens
    Parâmetro Descrição Obrigatório ou não?
    Caminho da Pasta Usa o caminho de destino em que as imagens extraídas serão salvas de um componente executado anteriormente. Sim
    Número da página Usa o número da página do documento PDF para extrair essa página somente de um componente executado anteriormente. Não. Conectar a porta é opcional.
    Nomes de arquivo Retorna o caminho e os nomes das imagens extraídas e passa para os próximos componentes. Sim

    Obter todas as tabelas

    Recupera todos os dados tabulares em um documento PDF como uma lista. Use o parâmetro Retorno para recuperar os dados da tabela extraídos como uma lista.

    GetPageAsImage

    Extrai dados de uma página de documento PDF e os armazena como uma imagem na memória.

    Tabela 6. Parâmetros do método GetPageAsImage
    Parâmetro Descrição Obrigatório ou não?
    Número da página Usa o número da página do documento PDF para extrair essa página somente de um componente executado anteriormente. Não. Conectar a porta é opcional.
    Retornar Retorna a imagem na memória como um bitmap e passa para o próximo componente. Sim

    GetPageCount

    Recupera o número total de páginas em um documento PDF. Você deve usar o parâmetro Retorno para recuperar a contagem total de páginas no PDF como um número inteiro.

    Obter tabela

    Extraia todas as tabelas de um documento PDF e retorne os dados tabulares como uma tabela de dados.

    Tabela 7. Parâmetros do método GetTable
    Parâmetro Descrição Obrigatório ou não?
    Extrair por Usa o caminho para o documento PDF de um componente executado anteriormente. Sim
    valor O formato da tabela. Por exemplo, cadeia de caracteres. Não
    Retornar Retorna as tabelas como uma tabela de dados. Não

    Obter texto

    Extrai texto de um documento PDF.

    Tabela 8. Parâmetros do método GetText
    Parâmetro Descrição Obrigatório ou não?
    Da página O número da página para iniciar a recuperação do texto. Use esta opção se quiser recuperar o texto entre um intervalo de páginas. O valor padrão é zero. Não
    ParaPágina O número da página para a qual você recupera o texto da página inicial.
    Nota:
    Certifique-se de que o valor de ToPage seja maior do que o valor de FromPage.
    Não
    Retornar Retorna o texto extraído como uma cadeia de caracteres e passa para o próximo componente. Sim

    Carregar

    Carrega um arquivo PDF na automação. Use este método para carregar o arquivo PDF na automação antes de usar qualquer outro método de PDF.

    Tabela 9. Parâmetros do método Carregar
    Parâmetro Descrição Obrigatório ou não?
    Caminho do arquivo Caminho do arquivo PDF Sim
    Senha Senha para o documento se ele for protegido por senha. Não

    Mesclar

    Combina vários arquivos PDF.
    Tabela 10. Parâmetros do método Mesclar
    Parâmetro Descrição Obrigatório ou não?
    Lista de arquivos Lista de arquivos PDF que você deseja mesclar. Os arquivos devem ser listados em um formato de matriz. Sim
    Caminho do arquivo de saída Caminho para gerar a saída mesclada dos arquivos PDF. Sim
    Substituir Substitui um arquivo no diretório de saída se o arquivo tiver o mesmo nome especificado no parâmetro SaídaFilePath. O valor padrão é definido como Não. Não
    Nota:
    Se os arquivos PDF forem protegidos por senha ou em um formato incorreto no parâmetro FileList, a automação exibirá um erro.

    Divisão

    Divide um único arquivo PDF em vários arquivos PDF. Cada página de um arquivo PDF é gerada como um PDF separado. Use o parâmetro SaídaFolderPath para especificar o caminho no qual você deseja gerar os arquivos.

    Fechar

    Fecha as referências do arquivo PDF que você carrega na automação usando o método Load.