Usar o componente Texto de OCR

  • Versão de lançamento: Washingtondc
  • Atualizado 1 de fev. de 2024
  • 2 min. de leitura
  • Extraia o texto de uma imagem usando o componente Texto de OCR em Design studio de RPA para desktop.

    Antes de Iniciar

    Função necessária: nenhuma

    Por Que e Quando Desempenhar Esta Tarefa

    Muitas propriedades do componente Texto de OCR são comuns a outros componentes de IU de ações. Para configurar essas propriedades, consulte Propriedades dos componentes de Ações (IU).

    As propriedades exclusivas do componente Texto de OCR são fornecidas.
    Tabela 1. Propriedades do componente de texto de OCR
    Propriedade Texto
    Origem de imagem Origem da qual o componente obtém a imagem.

    Procedimento

    1. No painel Caixa de ferramentas, navegue até Ações (IU) > Texto de OCR.
    2. Arraste o componente Texto de OCR para a superfície Design.
    3. Opcional: Para definir as configurações, clique no ícone de configurações do componente (ícone de configurações do componente).
      O componente tem configurações padrão que você pode revisar e usar.
    4. Opcional: Defina as configurações conforme descrito na tabela a seguir.
      Tabela 2. Configurações de OCR
      Campo Descrição
      Mecanismo Nome do mecanismo usado para extrair os campos de OCR.
      Idioma Mecanismo Teseract que pode oferecer suporte a vários idiomas. O usuário pode selecionar qualquer idioma listado aqui.
      Tolerância de altura da linha Altura da linha da fonte.
      ChangeDPI Altera o DPI (Dots Per Inch) da imagem, conforme mencionado na propriedade DPI.
      DPI Valor de DPI.
      Extrair palavras Texto extraído em formato Word. Caso contrário, será texto sem formatação.
      Inverter Cor da imagem que está invertida. Por exemplo, ele reverte o preto para branco.
      Idioma Idioma usado para extrair.
      Imagem da escala Dimensiona a imagem pelo número fornecido.
      Limite Imagem que é convertida de imagem em escala de cinza ou ruído que é removido de acordo com o valor do limite.
      Valor de Limite Valor limite.
      Tempo limite Tempo após o qual a operação do componente expira.
    5. Para fechar a janela Configurações de OCR, clique em OK.
    6. Para configurar a entrada, consulte Configurar propriedades da porta.
    7. Para configurar a saída, consulte Configurar propriedades da porta de saída.
    8. Opcional: Conecte as portas conforme descrito na tabela a seguir.
      Tipo de porta Nome da porta Tipo de dados Finalidade Obrigatório? Anotações
      Dados em Caminho da imagem/arquivo Bitmap/cadeia de caracteres Usa a imagem ou o caminho para a imagem. Sim A entrada depende da opção selecionada na opção Origem da imagemem Propriedades.
      • Porta: o tipo de dados é Bitmap.
      • Caminho do arquivo: o tipo de dados é Cadeia de caracteres.
      Dados esgotados Texto Cadeia de caracteres Retorna o texto extraído da imagem. Não. A conexão desta porta é opcional.
      Dados esgotados Confiança Único(a) Retorna o valor de precisão do texto extraído. Não. A conexão desta porta é opcional.
    9. Para testar o componente, clique com o botão direito do mouse na barra de componentes e clique em Executar a partir daqui.

    Extrair texto de imagens e exibir com o componente Mostrar

    O componente Texto de OCR usa um caminho para uma imagem. A imagem inclui o texto "servicenow". O componente extrai o texto da imagem e passa a cadeia de caracteres para o componente Mostrar (para usar o componente Mostrar, consulte Usar o componente Mostrar). O componente Mostrar leva o texto pela porta de entrada de dados da mensagem e exibe o texto em uma janela.