OCR Text コンポーネントの使用

リリースバージョン: Australia

更新日 2026年03月12日

所要時間：3分

RPA デスクトップデザインスタジオの OCR (光学式文字認識) Text コンポーネントを使用して、画像からテキストを抽出します。

始める前に

必要なロール：なし

このタスクについて

重要:

Yokohama リリース以降、RPA デスクトップデザインスタジオは最新バージョンの Tesseract OCR エンジンを利用します。この更新により、イメージの前処理とパフォーマンスの最適化が改善されます。OCR テキストコンポーネントを含む古い自動化を更新すると、出力にわずかな違いが生じる場合があります。したがって、更新後に自動化を検証することが重要です。

OCR Text コンポーネントの多くのプロパティは、他の Actions UI コンポーネントと共通です。これらのプロパティを設定するには、「Actions (UI) コンポーネントのプロパティ」を参照してください。

OCR Text コンポーネントに固有のプロパティは以下のとおりです。

表 : 1. OCR Text コンポーネントのプロパティ
プロパティ	テキスト
イメージソース	コンポーネントが画像を取得する元となるソースです。

手順

[ツールボックス] ペインで、 Actions (UI) > OCR テキスト.
OCR Text コンポーネントを [デザイン面 (Design surface)] にドラッグします。
オプション: 設定を行うには、コンポーネント設定アイコン () をクリックします。
コンポーネントにはデフォルト設定があり、確認して使用できます。

オプション: 下表に従って、設定を行います。

表 : 2. OCR 設定
フィールド	説明
エンジン	OCR フィールドの抽出に使用されるエンジン名。
言語	多言語対応可能な Teseract エンジンです。ユーザーは、ここにリストされている言語を選択できます。
行高さの許容範囲	フォントの行の高さ
ChangeDPI	DPI プロパティに示されているとおりに、画像の DPI を変更します。
DPI	DPI 値。
単語を抽出	ワード形式で抽出されるテキストです。それ以外はプレーンテキストです。
反転	反転された画像の色です。たとえば、黒を白に反転します。
言語	抽出に使用される言語です。
スケール画像	画像を指定された数値でスケーリングします。
しきい値	グレースケール画像から変換された画像、またはしきい値に従って除去されたノイズです。
しきい値	しきい値です。
タイムアウト	コンポーネントの処理がタイムアウトするまでの時間です。

[OCR 設定 (OCR Settings)] ウィンドウを閉じるには、[OK] をクリックします。
入力を設定するには、「ポートのプロパティを設定する」を参照してください。
出力を設定するには、「出力ポートのプロパティを設定する」を参照してください。

オプション: 下表に従って、ポートを接続します。


ポートタイプ	ポート名	データタイプ	目的	メモ
データ入力	画像 / ファイルパス	ビットマップ / 文字列	画像または画像へのパスを取得します。	入力は、[プロパティ] の [イメージソース] オプションで選択されたオプションによって異なります。 [Port]：データタイプはビットマップです。 [File Path]：データタイプは文字列です。
データ出力	テキスト	文字列	画像から抽出されたテキストを返します。
データ出力	信頼性	個数	抽出されたテキスト精度の数値を返します。

コンポーネントをテストするには、コンポーネントバーを右クリックし、[ここから実行 (Run From Here)] をクリックします。

画像からテキストを抽出し、Show コンポーネントで表示する

画像からテキストを抽出し、Show コンポーネントで表示します。

OCR Text コンポーネントは、画像へのパスを取得します。画像は「servicenow」というテキストで構成されています。コンポーネントは画像からテキストを抽出し、その文字列を Show コンポーネントに渡します (Show コンポーネントを使用するには、「Show コンポーネントの使用」を参照してください)。Show コンポーネントは、メッセージデータ入力ポートを介してテキストを取得し、ウィンドウにテキストを表示します。