Utiliser le composant texte OCR

  • Rversion finale: Washingtondc
  • Mis à jour 1 févr. 2024
  • 2 minutes de lecture
  • Extraire le texte d’une image à l’aide du composant Texte OCR dans Studio de conception de bureau de RPA.

    Avant de commencer

    Rôle requis : aucun

    Pourquoi et quand exécuter cette tâche

    De nombreuses propriétés du composant Texte OCR sont communes à d’autres composants de l’interface utilisateur Actions. Pour configurer ces propriétés, reportez-vous Propriétés des composants d’actions (interface utilisateur)à .

    Les propriétés propres au composant Texte OCR sont données.
    Tableau 1. Propriétés du composant texte OCR
    Propriété Texte
    Image source Source à partir de laquelle le composant prend l’image.

    Procédure

    1. Dans le volet Boîte à outils, accédez à Actions (interface utilisateur) > Texte OCR.
    2. Faites glisser le composant Texte OCR vers la surface de conception.
    3. Facultatif : Pour configurer les paramètres, cliquez sur l’icône des paramètres du composant ( icône des paramètres du composant).
      Le composant comporte des paramètres par défaut que vous pouvez examiner et utiliser.
    4. Facultatif : Configurez les paramètres comme décrit dans le tableau suivant.
      Tableau 2. Paramètres OCR
      Champ Description
      Moteur Nom du moteur utilisé pour extraire les champs OCR.
      Langue Moteur Teseract qui peut prendre en charge plusieurs langues. L’utilisateur peut sélectionner n’importe quelle langue répertoriée ici.
      Tolérance de hauteur de ligne Hauteur de ligne de police.
      Changer DPI Modifie les points par pouce (PPP) de l’image comme mentionné dans la propriété PPP.
      DPI Valeur PPP.
      Extraire les mots Texte extrait au format Word. Sinon, il s’agit de texte brut.
      Inverser Couleur de l’image inversée. Par exemple, il inverse le noir en blanc.
      Langue Langue utilisée pour l’extraction.
      Échelle de l’image Met à l’échelle l’image selon le nombre indiqué.
      Seuil Image convertie à partir de l’image en niveaux de gris ou du bruit supprimé conformément à la valeur de seuil.
      Valeur de seuil Valeur de seuil.
      Délai Heure après laquelle le fonctionnement du composant expire.
    5. Pour fermer la fenêtre Paramètres OCR, cliquez sur OK.
    6. Pour configurer l’entrée, reportez-vous à la section Configurer les propriétés du port.
    7. Pour configurer la sortie, reportez-vous à la section Configurer les propriétés du port de sortie.
    8. Facultatif : Connectez les ports comme décrit dans le tableau suivant.
      Type de port Nom de port Type de données Objectif Obligatoire? Notes
      Données entrantes Chemin d’accès à l’image/fichier Bitmap/chaîne Prend l’image ou le chemin d’accès à l’image. Oui L’entrée dépend de l’option sélectionnée dans l’option Source de l’imagedans les Propriétés.
      • Port : le type de données est Bitmap.
      • Chemin d’accès au fichier : le type de données est chaîne.
      Données sortantes Texte Chaîne Renvoie le texte extrait de l’image. Non. La connexion de ce port est facultative.
      Données sortantes Fiabilité Unique Renvoie la figure de précision du texte extrait. Non. La connexion de ce port est facultative.
    9. Pour tester le composant, cliquez avec le bouton droit sur la barre du composant, puis cliquez sur Exécuter à partir d’ici.

    Extraire du texte à partir d’images et afficher avec le composant Afficher

    Le composant Texte OCR emprunte un chemin d’accès à une image. L’image comprend le texte « servicenow ». Le composant extrait le texte de l’image et transmet la chaîne au composant Show (pour utiliser le composant Show, reportez-vous à la section Utiliser le composant Afficher). Le composant Show prend le texte via le port Message Data In, puis affiche le texte dans une fenêtre.