Usar o componente de texto OCR

  • Versão de lançamento: Yokohama
  • Atualizado 30 de jan. de 2025
  • 2 min. de leitura
  • Extraia o texto de uma imagem usando o componente de texto OCR em Design studio de RPA para desktop.

    Antes de Iniciar

    Função necessária: nenhuma

    Por Que e Quando Desempenhar Esta Tarefa

    Muitas propriedades do componente Texto de OCR são comuns a outros componentes de IU Ações. Para configurar essas propriedades, consulte Propriedades dos componentes de Ações (IU).

    As propriedades exclusivas do componente de texto OCR são fornecidas.
    Tabela 1. Propriedades do componente de texto de OCR
    Propriedade Texto
    Origem de imagem Origem da qual o componente obtém a imagem.

    Procedimento

    1. No painel Caixa de ferramentas, navegue até Ações (IU) > Texto de OCR.
    2. Arraste o componente Texto de OCR para a superfície Design.
    3. Opcional: Para definir as configurações, clique no ícone de configurações do componente ( ícone Configurações do componente).
      O componente tem configurações padrão que você pode revisar e usar.
    4. Opcional: Defina as configurações conforme descrito na tabela a seguir.
      Tabela 2. Configurações de OCR
      Campo Descrição
      Mecanismo Nome do mecanismo usado para extrair os campos de OCR.
      Idioma Mecanismo Teseract que pode oferecer suporte a vários idiomas. O usuário pode selecionar qualquer idioma listado aqui.
      Tolerância de altura da linha Altura da linha da fonte.
      MudançaDPI Altera os pontos por polegadas (DPI) da imagem conforme mencionado na propriedade de DPI.
      DPI Valor de DPI.
      Extrair palavras Texto extraído em um formato de Word. Caso contrário, é texto simples.
      Inverter Cor da imagem invertida. Por exemplo, ele reverte o preto para branco.
      Idioma Idioma usado para extrair.
      Imagem da escala Dimensiona a imagem pelo número fornecido.
      Limite Imagem que é convertida de imagem em escala de cinza ou ruído que é removido de acordo com o valor do limite.
      Valor de Limite Valor do limite.
      Tempo limite Tempo após o qual a operação do componente expira.
    5. Para fechar a janela Configurações de OCR, clique em OK.
    6. Para configurar a entrada, consulte Configurar propriedades da porta.
    7. Para configurar a saída, consulte Configurar propriedades da porta de saída.
    8. Opcional: Conecte as portas conforme descrito na tabela a seguir.
      Tipo de porta Nome da porta Tipo de dados Finalidade Obrigatório? Anotações
      Entrada de dados Caminho da imagem/arquivo Bitmap/cadeia de caracteres Usa a imagem ou o caminho para a imagem. Sim A entrada depende da opção selecionada na opção Origem da imagemem Propriedades.
      • Porta: o tipo de dados é Bitmap.
      • Caminho do arquivo: o tipo de dados é cadeia de caracteres.
      Saída de dados Texto Cadeia de caracteres Retorna o texto extraído da imagem. Não. A conexão desta porta é opcional.
      Saída de dados Confiança Solteiro(a) Retorna o valor de precisão do texto extraído. Não. A conexão desta porta é opcional.
    9. Para testar o componente, clique com o botão direito do mouse na barra do componente e clique em Executar a partir daqui.

    Extrair texto de imagens e exibir com o componente Mostrar

    O componente de texto OCR usa um caminho para uma imagem. A imagem contém o texto "servicenow". O componente extrai o texto da imagem e passa a cadeia de caracteres para o componente Mostrar (para usar o componente Mostrar, consulte Usar o componente Mostrar). O componente Mostrar leva o texto pela porta de entrada de dados da mensagem e exibe o texto em uma janela.