Utiliser le composant Texte OCR

  • Rversion finale: Xanadu
  • Mis à jour 1 août 2024
  • 2 minutes de lecture
  • Extrayez le texte d’une image à l’aide du composant Texte OCR de .Studio de conception de bureau de RPA

    Avant de commencer

    Rôle requis : aucun

    Pourquoi et quand exécuter cette tâche

    De nombreuses propriétés du composant Texte OCR sont communes à d’autres composants de l’interface utilisateur Actions. Pour configurer ces propriétés, reportez-vous à la section Propriétés des composants d’actions (interface utilisateur).

    Les propriétés uniques au composant Texte OCR sont données.
    Tableau 1. Propriétés des composants de texte OCR
    Propriété Texte
    Image source Source à partir de laquelle le composant prend l’image.

    Procédure

    1. Dans la fenêtre Toolbox (Boîte à outils), accédez à Actions (UI) > Texte OCR.
    2. Faites glisser le composant Texte OCR vers l’aire de conception.
    3. Facultatif : Pour configurer les paramètres, cliquez sur l’icône des paramètres du composant (icône Paramètres du composant).
      Le composant comporte des paramètres par défaut que vous pouvez examiner et utiliser.
    4. Facultatif : Configurez les paramètres comme décrit dans le tableau suivant.
      Tableau 2. Paramètres OCR
      Champ Description
      Moteur Nom du moteur utilisé pour extraire les champs OCR.
      Langue Moteur Teseract pouvant prendre en charge plusieurs langues. L’utilisateur peut sélectionner n’importe quelle langue répertoriée ici.
      Tolérance de hauteur de ligne Hauteur de ligne de police.
      Changer DPI Modifie les points par pouce (PPP) de l’image comme indiqué dans la propriété PPP.
      DPI Valeur PPP.
      Extraire des mots Texte extrait au format Word. Sinon, c’est du texte brut.
      Renverser Couleur de l’image inversée. Par exemple, il inverse le noir en blanc.
      Langue Langue utilisée pour l’extraction.
      Échelle de l’image Met l’image à l’échelle selon le nombre indiqué.
      Seuil Image convertie en niveaux de gris ou bruit supprimé conformément à la valeur de seuil.
      Valeur de seuil Seuil.
      Délai Heure après laquelle l’opération du composant expire.
    5. Pour fermer la fenêtre Paramètres OCR, cliquez sur OK.
    6. Pour configurer l’entrée, reportez-vous à la section Configurer les propriétés des ports.
    7. Pour configurer la sortie, reportez-vous à la section Configurer les propriétés du port de sortie.
    8. Facultatif : Connectez les ports comme décrit dans le tableau suivant.
      Type de port Nom de port Type de données Objectif Obligatoire? Notes
      Données dans Chemin d’accès à l’image/fichier Bitmap/chaîne Prend l’image ou le chemin d’accès à l’image. Oui L’entrée dépend de l’option sélectionnée dans l’option Source de l’imagedans les propriétés.
      • Port : le type de données est Bitmap.
      • Chemin d’accès au fichier : le type de données est Chaîne.
      Sortie de données Texte Chaîne Renvoie le texte extrait de l’image. Non. La connexion de ce port est facultative.
      Sortie de données Fiabilité Unique Renvoie la figure de précision du texte extrait. Non. La connexion de ce port est facultative.
    9. Pour tester le composant, cliquez avec le bouton droit sur la barre du composant, puis cliquez sur Exécuter à partir d’ici.

    Extraire le texte des images et l’afficher avec le composant Afficher

    Le composant Texte OCR prend un chemin d’accès à une image. L’image comprend le texte « servicenow ». Le composant extrait le texte de l’image et transmet la chaîne au composant Afficher (pour utiliser le composant Afficher, reportez-vous à la section Utiliser le composant Afficher). Le composant Afficher fait passer le texte par le port d’entrée des données du message, puis affiche le texte dans une fenêtre.