Verwenden Sie die OCR-Textkomponente

Freigeben Version: Washingtondc

Aktualisiert 1. Februar 2024

2 Minuten Lesedauer

Extrahieren Sie den Text aus einem Bild mithilfe der OCR-Textkomponente in RPA Desktop Design Studio.

Vorbereitungen

Erforderliche Rolle: keine

Warum und wann dieser Vorgang ausgeführt wird

Viele Eigenschaften der OCR-Textkomponente sind bei anderen UI-Komponenten für Aktionen gleich. Informationen zum Konfigurieren dieser Eigenschaften finden Sie unter Eigenschaften von Aktionskomponenten (UI)..

Die für die OCR-Textkomponente eindeutigen Eigenschaften sind angegeben.

Tabelle : 1. Eigenschaften der OCR-Textkomponente
Eigenschaft	Text
Bildquelle	Quelle, aus der die Komponente das Image übernimmt.

Prozedur

Navigieren Sie im Toolbox-Bereich zu Aktionen (UI) > OCR-Text.
Ziehen Sie die OCR-Textkomponente auf die Designoberfläche.
Wahlweise: Um die Einstellungen zu konfigurieren, klicken Sie auf das Symbol für ).
Die Komponente verfügt über Standardeinstellungen, die Sie überprüfen und verwenden können.

Wahlweise: Konfigurieren Sie die Einstellungen wie in der folgenden Tabelle beschrieben.

Tabelle : 2. OCR-Einstellungen
Feld	Beschreibung
Engine	Name der Engine, die zum Extrahieren der OCR-Felder verwendet wird.
Sprache	Teseract-Engine, die mehrere Sprachen unterstützen kann. Der Benutzer kann eine beliebige hier aufgeführte Sprache auswählen.
Toleranz für Linienhöhe	Schriftzeilenhöhe.
ChangeDPI	Ändert die Punkte pro Zoll (DPI) des Bildes, wie in der DPI-Eigenschaft erwähnt.
DPI	DPI-Wert
Extrahieren Sie Wörter	Text, der in einem Wortformat extrahiert wird. Andernfalls handelt es sich um Nur-Text.
Umkehren	Invertierte Bildfarbe. Zum Beispiel wird Schwarz in Weiß invertiert.
Sprache	Sprache, die zum Extrahieren verwendet wird.
Bild skalieren	Skaliert das Bild um die angegebene Zahl.
Schwellenwert	Bild, das aus einem Graustufenbild konvertiert wird, oder Rauschen, das gemäß dem Schwellenwert entfernt wird.
Schwellenwert	Schwellenwert.
Zeitüberschreitung	Zeit, nach der der Komponentenvorgang abläuft.

Um das Fenster „OCR-Einstellungen“ zu schließen, klicken Sie auf OK.
Informationen zum Konfigurieren der Eingabe finden Sie unter Konfigurieren Sie Porteigenschaften.
Informationen zum Konfigurieren der Ausgabe finden Sie unter Konfigurieren Sie die Eigenschaften des Ausgabeports.

Wahlweise: Verbinden Sie die Ports wie in der folgenden Tabelle beschrieben.


Porttyp	Portname	Datentyp	Zweck	Obligatorisch?	Notizen
Daten ein	Bild-/Dateipfad	Bitmap/Zeichenfolge	Verwendet das Image oder den Pfad zum Image.	Ja	Die Eingabe hängt von der Optionab, die in den Eigenschaften unter Bildquelle ausgewählt wurde. Port: Der Datentyp ist Bitmap. Dateipfad: Der Datentyp ist Zeichenfolge.
Datenausgabe	Text	Zeichenfolge	Gibt den extrahierten Text aus dem Bild zurück.	Nein. Die Verbindung dieses Ports ist optional.
Datenausgabe	Vertrauen	Einzeln	Gibt die Zahl der extrahierten Textgenauigkeit zurück.	Nein. Die Verbindung dieses Ports ist optional.

Um die Komponente zu testen, klicken Sie mit der rechten Maustaste auf die Komponentenleiste, und klicken Sie dann auf Von hier ausführen.

Extrahieren Sie Text aus Bildern und zeigen Sie ihn mit der Komponente „Anzeigen“ an

Die OCR-Textkomponente verwendet einen Pfad zu einem Bild. Das Bild enthält den Text „servicenow“. Die Komponente extrahiert den Text aus dem Bild und übergibt die Zeichenfolge an die Show-Komponente (Informationen zur Verwendung der Show-Komponente finden Sie unter Verwenden Sie die Komponente Anzeigen). Die Komponente „Anzeigen“ leitet den Text durch den Nachrichtendateneingang und zeigt den Text in einem Fenster an.