Verwenden Sie die OCR-Textkomponente

  • Freigeben Version: Yokohama
  • Aktualisiert 30. Januar 2025
  • 2 Minuten Lesedauer
  • Extrahieren Sie den Text aus einem Bild, indem Sie die Komponente OCR-Text in RPA Desktop Design Studioverwenden.

    Vorbereitungen

    Erforderliche Rolle: keine

    Warum und wann dieser Vorgang ausgeführt wird

    Viele Eigenschaften der OCR-Textkomponente entsprechen anderen UI-Komponenten für Aktionen. Informationen zum Konfigurieren dieser Eigenschaften finden Sie unter Eigenschaften von Aktionskomponenten (UI)..

    Die für die OCR-Textkomponente eindeutigen Eigenschaften werden angegeben.
    Tabelle : 1. OCR-Textkomponenteneigenschaften
    Eigenschaft Text
    Bildquelle Quelle, aus der die Komponente das Bild nimmt.

    Prozedur

    1. Navigieren Sie im Bereich Toolbox zu Aktionen (UI) > OCR-Text.
    2. Ziehen Sie die Komponente OCR-Text auf die Designoberfläche.
    3. Wahlweise: Um die Einstellungen zu konfigurieren, klicken Sie auf das Symbol für Komponenteneinstellungen ( Symbol für Komponenteneinstellungen.).
      Die Komponente verfügt über Standardeinstellungen, die Sie überprüfen und verwenden können.
    4. Wahlweise: Konfigurieren Sie die Einstellungen wie in der folgenden Tabelle beschrieben.
      Tabelle : 2. OCR-Einstellungen
      Feld Beschreibung
      Engine Name der Engine, die zum Extrahieren der OCR-Felder verwendet wird.
      Sprache Teseract-Engine, die mehrere Sprachen unterstützen kann. Der Anwender kann jede hier aufgeführte Sprache auswählen.
      Toleranz für Zeilenhöhe Schriftzeilenhöhe.
      ChangeDPI Ändert die Dots Per Zoll (DPI) des Bildes wie in der DPI-Eigenschaft erwähnt.
      DPI DPI-Wert.
      Wörter extrahieren Text, der in einem Wortformat extrahiert wird. Andernfalls handelt es sich um Nur-Text.
      Umkehren Bildfarbe, die invertiert ist. Beispielsweise wird Schwarz in Weiß invertiert.
      Sprache Sprache, die zum Extrahieren verwendet wird.
      Bild skalieren Skaliert das Bild um die angegebene Zahl.
      Schwellenwert Bild, das aus einem Graustufenbild oder Rauschen konvertiert wird, das gemäß dem Schwellenwert entfernt wird.
      Schwellenwert Schwellenwert
      Zeitüberschreitung Zeit, nach der der Komponentenvorgang abläuft.
    5. Klicken Sie auf OK, um das Fenster mit den OCR-Einstellungen zu schließen.
    6. Informationen zum Konfigurieren der Eingabe finden Sie unter Porteigenschaften konfigurieren.
    7. Informationen zum Konfigurieren der Ausgabe finden Sie unter Konfigurieren Sie die Eigenschaften des Ausgabeports.
    8. Wahlweise: Verbinden Sie die Ports wie in der folgenden Tabelle beschrieben.
      Porttyp Portname Datentyp Zweck Obligatorisch? Notizen
      Dateneingang Bild-/Dateipfad Bitmap/Zeichenfolge Übernimmt das Image oder den Pfad zum Image. Ja Die Eingabe hängt von der Option ab, die in den Eigenschaften unter Bildquelleausgewählt wurde.
      • Port: Der Datentyp ist Bitmap.
      • Dateipfad: Der Datentyp ist „Zeichenfolge“.
      Daten aus Text Zeichenfolge Gibt den extrahierten Text aus dem Bild zurück. Nein. Die Verbindung dieses Ports ist optional.
      Daten aus Vertrauen Einzeln Gibt die Zahl der extrahierten Textgenauigkeit zurück. Nein. Die Verbindung dieses Ports ist optional.
    9. Um die Komponente zu testen, klicken Sie mit der rechten Maustaste auf die Komponentenleiste und dann auf Von hier ausführen.

    Extrahieren Sie Text aus Bildern, und zeigen Sie ihn mit der Komponente „Anzeigen“ an

    Die OCR-Textkomponente verwendet einen Pfad zu einem Bild. Das Bild enthält den Text „servicenow“. Die Komponente extrahiert den Text aus dem Bild und übergibt die Zeichenfolge an die Show-Komponente (Informationen zur Verwendung der Show-Komponente finden Sie unter Verwenden Sie die Komponente Anzeigen). Die Komponente „Anzeigen“ leitet den Text durch den Nachrichtendateneingang ein und zeigt den Text dann in einem Fenster an.