Verwenden Sie die OCR-Textkomponente

  • Freigeben Version: Washingtondc
  • Aktualisiert 1. Februar 2024
  • 2 Minuten Lesedauer
  • Extrahieren Sie den Text aus einem Bild mithilfe der OCR-Textkomponente in RPA Desktop Design Studio.

    Vorbereitungen

    Erforderliche Rolle: keine

    Warum und wann dieser Vorgang ausgeführt wird

    Viele Eigenschaften der OCR-Textkomponente sind bei anderen UI-Komponenten für Aktionen gleich. Informationen zum Konfigurieren dieser Eigenschaften finden Sie unter Eigenschaften von Aktionskomponenten (UI)..

    Die für die OCR-Textkomponente eindeutigen Eigenschaften sind angegeben.
    Tabelle : 1. Eigenschaften der OCR-Textkomponente
    Eigenschaft Text
    Bildquelle Quelle, aus der die Komponente das Image übernimmt.

    Prozedur

    1. Navigieren Sie im Toolbox-Bereich zu Aktionen (UI) > OCR-Text.
    2. Ziehen Sie die OCR-Textkomponente auf die Designoberfläche.
    3. Wahlweise: Um die Einstellungen zu konfigurieren, klicken Sie auf das Symbol für Komponenteneinstellungen (Symbol für Komponenteneinstellungen).
      Die Komponente verfügt über Standardeinstellungen, die Sie überprüfen und verwenden können.
    4. Wahlweise: Konfigurieren Sie die Einstellungen wie in der folgenden Tabelle beschrieben.
      Tabelle : 2. OCR-Einstellungen
      Feld Beschreibung
      Engine Name der Engine, die zum Extrahieren der OCR-Felder verwendet wird.
      Sprache Teseract-Engine, die mehrere Sprachen unterstützen kann. Der Benutzer kann eine beliebige hier aufgeführte Sprache auswählen.
      Toleranz für Linienhöhe Schriftzeilenhöhe.
      ChangeDPI Ändert die Punkte pro Zoll (DPI) des Bildes, wie in der DPI-Eigenschaft erwähnt.
      DPI DPI-Wert
      Extrahieren Sie Wörter Text, der in einem Wortformat extrahiert wird. Andernfalls handelt es sich um Nur-Text.
      Umkehren Invertierte Bildfarbe. Zum Beispiel wird Schwarz in Weiß invertiert.
      Sprache Sprache, die zum Extrahieren verwendet wird.
      Bild skalieren Skaliert das Bild um die angegebene Zahl.
      Schwellenwert Bild, das aus einem Graustufenbild konvertiert wird, oder Rauschen, das gemäß dem Schwellenwert entfernt wird.
      Schwellenwert Schwellenwert.
      Zeitüberschreitung Zeit, nach der der Komponentenvorgang abläuft.
    5. Um das Fenster „OCR-Einstellungen“ zu schließen, klicken Sie auf OK.
    6. Informationen zum Konfigurieren der Eingabe finden Sie unter Konfigurieren Sie Porteigenschaften.
    7. Informationen zum Konfigurieren der Ausgabe finden Sie unter Konfigurieren Sie die Eigenschaften des Ausgabeports.
    8. Wahlweise: Verbinden Sie die Ports wie in der folgenden Tabelle beschrieben.
      Porttyp Portname Datentyp Zweck Obligatorisch? Notizen
      Daten ein Bild-/Dateipfad Bitmap/Zeichenfolge Verwendet das Image oder den Pfad zum Image. Ja Die Eingabe hängt von der Optionab, die in den Eigenschaften unter Bildquelle ausgewählt wurde.
      • Port: Der Datentyp ist Bitmap.
      • Dateipfad: Der Datentyp ist Zeichenfolge.
      Datenausgabe Text Zeichenfolge Gibt den extrahierten Text aus dem Bild zurück. Nein. Die Verbindung dieses Ports ist optional.
      Datenausgabe Vertrauen Einzeln Gibt die Zahl der extrahierten Textgenauigkeit zurück. Nein. Die Verbindung dieses Ports ist optional.
    9. Um die Komponente zu testen, klicken Sie mit der rechten Maustaste auf die Komponentenleiste, und klicken Sie dann auf Von hier ausführen.

    Extrahieren Sie Text aus Bildern und zeigen Sie ihn mit der Komponente „Anzeigen“ an

    Die OCR-Textkomponente verwendet einen Pfad zu einem Bild. Das Bild enthält den Text „servicenow“. Die Komponente extrahiert den Text aus dem Bild und übergibt die Zeichenfolge an die Show-Komponente (Informationen zur Verwendung der Show-Komponente finden Sie unter Verwenden Sie die Komponente Anzeigen). Die Komponente „Anzeigen“ leitet den Text durch den Nachrichtendateneingang und zeigt den Text in einem Fenster an.