Utiliser le composant de texte OCR

  • Rversion finale: Yokohama
  • Mis à jour 30 janv. 2025
  • 2 minutes de lecture
  • Extrayez le texte d’une image à l’aide du composant Texte OCR dans Studio de conception de bureau de RPA.

    Avant de commencer

    Rôle requis : aucun

    Pourquoi et quand exécuter cette tâche

    De nombreuses propriétés du composant Texte OCR sont communes à d’autres composants de l’interface utilisateur Actions, pour configurer ces propriétés, reportez-vous à la section Propriétés des composants des actions (interface utilisateur).

    Les propriétés uniques au composant Texte OCR sont fournies.
    Tableau 1. Propriétés du composant de texte OCR
    Propriété Texte
    Image source Source à partir de laquelle le composant prend l’image.

    Procédure

    1. Dans le volet Boîte à outils, accédez à Actions (interface utilisateur) > Texte OCR.
    2. Faites glisser le composant de texte OCR vers l’aire de conception.
    3. Facultatif : Pour configurer les paramètres, cliquez sur l’icône Paramètres du composant ( Icône Paramètres du composant.).
      Le composant possède des paramètres par défaut que vous pouvez examiner et utiliser.
    4. Facultatif : Configurez les paramètres comme décrit dans le tableau suivant.
      Tableau 2. Paramètres OCR
      Champ Description
      Moteur Nom du moteur utilisé pour extraire les champs OCR.
      Langue Moteur Teseract pouvant prendre en charge plusieurs langues. L’utilisateur peut sélectionner n’importe quelle langue répertoriée ici.
      Tolérance de hauteur de ligne Hauteur de la ligne de police.
      Changer DPI Modifie les points par pouce (PPP) de l’image comme indiqué dans la propriété PPP.
      DPI Valeur PPP.
      Extraire les mots Texte extrait au format Word. Sinon, c’est du texte brut.
      Renverser Couleur de l’image inversée. Par exemple, il inverse le noir en blanc.
      Langue Langue utilisée pour l’extraction.
      Image à l’échelle Met l’image à l’échelle selon le nombre donné.
      Seuil Image convertie à partir d’une image en niveaux de gris ou d’un bruit supprimé selon la valeur de seuil.
      Valeur de seuil Seuil.
      Délai Délai après lequel l’opération du composant expire.
    5. Pour fermer la fenêtre Paramètres OCR, cliquez sur OK.
    6. Pour configurer l’entrée, reportez-vous à la section Configurer les propriétés des ports.
    7. Pour configurer la sortie, reportez-vous à la section Configurer les propriétés du port de sortie.
    8. Facultatif : Connectez les ports comme décrit dans le tableau suivant.
      Type de port Nom du port Type de données Objectif Obligatoire? Notes
      Données dans Chemin d’accès à l’image/au fichier Bitmap/Chaîne Prend l’image ou le chemin d’accès à l’image. Oui L’entrée dépend de l’option sélectionnée dans l’option Source d’imagedans les propriétés.
      • Port : le type de données est Bitmap.
      • Chemin d’accès au fichier : le type de données est Chaîne.
      Sortie de données Texte Chaîne Renvoie le texte extrait de l’image. Non. La connexion de ce port est facultative.
      Sortie de données Fiabilité Unique Renvoie le chiffre de précision du texte extrait. Non. La connexion de ce port est facultative.
    9. Pour tester le composant, cliquez avec le bouton droit sur la barre du composant, puis cliquez sur Exécuter à partir d’ici.

    Extraire le texte des images et l’afficher avec le composant Afficher

    Le composant de texte OCR prend un chemin d’accès à une image. L’image comprend le texte « servicenow ». Le composant extrait le texte de l’image et transmet la chaîne au composant Show (pour utiliser le composant Show, voir Utiliser le composant Afficher). Le composant Show fait passer le texte par le port d’entrée des données du message, puis affiche le texte dans une fenêtre.