描画ツールを使用したフィールドの抽出

  • リリースバージョン: Xanadu
  • 更新日 2024年08月01日
  • 所要時間:9分
  • 描画ツールを使用して、ドキュメント画像上の テキストや 表から直接情報を抽出します。

    描画ツールの概要

    処理済みのドキュメントを ドキュメントインテリジェンス (DocIntel) ワークスペースで表示しているときに、描画ツールを使用してドキュメント画像からフィールドを抽出してレビューできます。

    特に、レコメンデーションがまだない場合やレコメンデーションが正しくない場合は、抽出するドキュメントの特定の領域を選択するのに描画ツールが役立ちます。

    抽出されたテーブルフィールドは、テーブルの上のグリッドに既に表示されているはずです。抽出された単一のフィールドは、テキスト上にラベル付きボックスとして表示されます。 グリッド またはボックス から抽出されたフィールドを直接確認し、必要に応じて調整できます。テーブルフィールドが空の場合、またはグリッドがない場合は、テーブル上に 1 つ以上のグリッドを作成してフィールドを抽出できます。

    描画ツールは、ドキュメント画像上のテーブルの上にグリッドを作成します。

    描画ツールを使用した単一フィールドの抽出

    描画ツールを使用して、ドキュメント画像から単一のフィールドを直接抽出します。

    始める前に

    必要なロール:sn_docintel.extraction_agent

    このタスクについて

    描画ツールを使用してドキュメントから 1 つのフィールドを抽出するには、次の手順を使用します。抽出されたデータは、ドキュメントフィールドパネルの関連フィールドに入力するために使用されます。

    フィールドが自動入力されている場合、抽出されたテキストの上に既にボックスが表示されています。必要に応じてフィールドを調整できます。

    手順

    1. ドキュメントフィールドパネルで、[ フィールド] を展開します。
    2. フィールドを選択します。

      [描画ツール] アイコン ([ 描画ツール] アイコン)は、ドキュメント コントロール ツールバーで有効になっています。

      フィールドが既に自動入力されていて、ボックスがフィールドの上に表示されている場合、または既にボックスを描画している場合は、手順 5 に進みます。

    3. 描画ツールアイコン ( 描画ツールアイコン) を選択します。
    4. ドキュメント画像上の抽出する領域にボックスを描画します。
      テキストの上に編集可能なボックスが表示されます。ボックスの横にフィールド名が表示されます。ボックス内の抽出されたテキストが強調表示されます。
      図 : 1. 1 つのフィールドに描画されたボックス
      日付フィールドの値を抽出するためにドキュメントに描画されたボックス。

      抽出されたテキストは、ドキュメントフィールドパネルの関連フィールドに入力されます。

      ヒント:
      塗りつぶされたフィールドで Enter キーまたは Return To キーを押すと、次のフィールドに移動し、新しいボックスが描画されます。
    5. オプション: 必要に応じてボックスを調整します。
      オプションDescription (説明)
      ボックスのサイズを変更

      ボックスを選択します。ボックスの端または角を目的の位置にドラッグします。

      ボックス内の更新されたテキストが抽出され、ドキュメントフィールドパネルの関連フィールドに入力されます。

      ボックスを削除する

      [ボックスを削除] アイコン ( [ ボックスを削除] アイコン) を選択します。

      ボックスが削除され、抽出された値がフィールドから削除されます。

      別のフィールドに抽出

      ボックスの横にあるフィールド名を選択し、リストから別のオプションを選択します。

    6. オプション: フィールドに変更を入力して、抽出されたテキストを編集します。
      ドキュメントインテリジェンス (DocIntel) 選択した領域内のすべてのテキストが検出されない場合があります。この場合、フィールドに直接情報を入力する必要があります。

    描画ツールを使用したテーブルの抽出

    描画ツールを使用して、ドキュメント画像から直接テーブルを抽出します。

    始める前に

    必要なロール:sn_docintel.extraction_agent

    このタスクについて

    描画ツールを使用してドキュメントからテーブルを抽出するには、次の手順を使用します。抽出されたデータは、関連するテーブルフィールドに入力するために使用されます。

    テーブルフィールドが自動入力されている場合、抽出されたフィールドに基づく描画ツールグリッドが既に利用可能です。必要に応じてフィールドを調整できます。詳細については、「描画ツールグリッドを調整する」を参照してください。

    ドキュメントのページ全体で、表の複数のセクションを選択できます。

    手順

    1. ドキュメントフィールドパネルで、[テーブル] セクションを展開します。
      [テーブル] セクションには、テーブル フィールドグループに割り当てられたフィールドのみが表示されます。
    2. [テーブル] セクションでテーブルを選択します。

      テーブルパネルが表示され、「描画 ツール 」アイコン ( 描画ツールアイコン。が [ドキュメント コントロール] ツールバーで有効になっています。

      テーブルフィールドが既に自動入力されていて、グリッドがテーブルの上に表示される場合、または既にグリッドを描画している場合は、手順 5 に進みます。

      ヒント:
      必要に応じて、[テーブルパネルを折りたたむ] アイコン ([ テーブルパネルを折りたたむ] アイコン) を使用して、テーブルパネルを折りたたみます。
    3. 描画 ツール アイコン ( 描画ツールアイコン。
    4. ドキュメント画像上の抽出する領域にボックスを描画します。
      ヒント:
      選択領域にテーブルのヘッダー行を含めます。

      編集可能なグリッドがテーブル上に表示されます。グリッドは、選択した領域のテーブルセルを定義します。グリッド内の行番号は、テーブルパネルの行に対応しています。

      セル内のテキストは、テーブルフィールドに抽出される前に、点線のボックスで囲まれて表示されます。抽出されると、実線のボックスに表示されます。

      ドキュメント画像上のテーブル上に表示される描画ツールグリッド。

    5. 必要に応じてグリッドを調整します。

      詳細については、「描画ツールグリッドを調整する」を参照してください。

    6. オプション: ドキュメントの同じページまたは別のページにある表の別のセクションを選択するには:
      1. 描画 ツール アイコン ( 描画ツールアイコン。
      2. ドキュメント画像の抽出する他の領域にボックスを描画します。
        注:
        既存のグリッドの上に新しいグリッドを描画することはできません。
        テーブル名の横のグリッド番号は、更新されたグリッド番号を示します。たとえば、「品目 (2/2)」は、品目テーブルフィールドの抽出に使用される 2 つのグリッドの 2 番目のグリッドにいることを示します。
      3. 必要に応じてグリッドを調整します。
    7. オプション: グリッドを非表示にするには、[グリッドを表示/非表示] アイコン ( [グリッドを表示/非表示] アイコン) を選択します。

      半透明のボックスは、非表示のグリッドがドキュメント上のどこにあるかを示します。

      非表示のグリッドまたは [グリッドを表示/非表示] アイコンを選択してグリッドを表示します。

    8. 、データを抽出します
      • [データの抽出] を選択します。

        このボタンは、データがまだ抽出されていない場合に表示されます。

      • [ フィールドを更新] を選択します。

        このボタンは、テーブルフィールドがすでに入力されており、その一部を上書きする変更を行った場合に表示されます。

        [ フィールドを更新 ] ボタンには、更新するフィールドの数が表示されます。

      グリッド内のデータが抽出され、関連するテーブルのフィールドに入力するために使用されます。

      グリッドに空のセルまたは欠落している列がある場合、関連するテーブルフィールドは ドキュメントで [欠落] に設定されます。

    描画ツールグリッドを調整する

    描画ツールグリッドを調整して、ドキュメント画像から抽出する情報に合わせます。

    始める前に

    • これらの手順は、ドキュメント画像に描画ツールグリッドがあるテーブルに適用されます。詳細については、「描画ツールを使用したテーブルの抽出」を参照してください。
    • 必要なロール:sn_docintel.extraction_agent

    このタスクについて

    グリッドに変更を加えるには、次の手順に従います。その後、関連するテーブルフィールドへの更新を抽出できます。

    手順

    1. ドキュメント画像で、変更するグリッドを選択します。

      ドキュメントに複数のグリッドがある場合、編集ツールが表示されるのはそのうちの 1 つだけです。もう一方のグリッドは、編集用に選択するまでオーバーレイとして表示されます。

      描画モードグリッドを調整するためのツール。

    2. 必要に応じてグリッドを調整します。

      調整は自動保存されます。

      以前の抽出に変更をもたらす調整は、セルの隅に表示されます。

      セル内のテキストが既に抽出されている場合は、実線のボックスで囲まれて表示されます。まだ抽出されていない場合は、点線のボックスに表示されます。

      オプションDescription (説明)
      グリッドを移動する

      移動アイコン ( 移動アイコン) を目的の位置にドラッグします。

      列ヘッダーの変更

      列ヘッダーを選択し、テーブルフィールドでデータの抽出先の列を選択します。

      最初の行をヘッダー行にする

      行ヘッダーを選択し、[ This is a header row ] チェックボックスをオンにします。

      列または行の境界線を移動する

      境界線を目的の位置にドラッグします。

      新しい列または行を追加

      グリッドの外側の境界線に移動し、[線を追加]アイコン([ 線を追加]アイコン)を選択します。

      線を追加すると、影響を受けるセルが分割され、別々のフィールドに抽出できるようになります。

      列または行の境界線を削除する

      グリッドの外側の境界線の端にある [線を削除] アイコン ( [ 線を削除] アイコン) を選択します。

      行を削除すると、影響を受けるセルが結合され、同じフィールドに抽出できるようになります。

      グリッドを削除する

      [グリッドを削除] アイコン ( グリッドを 削除アイコン) を選択します。

      このアクションではグリッドのみが削除され、抽出されたデータは削除されません。

      テーブルの列または行を無視する
      1. 列見出しまたは行見出しを選択します。
      2. [ この列/行を抽出しない ] チェック ボックスをオンにします。
      3. [保存] を選択します。

    ドキュメント画像上のフィールドのレビュー

    描画ツールを使用して、自動入力されたフィールドをドキュメント画像パネルから直接確認します。

    始める前に

    手順

    1. ドキュメント画像上で、確認するグリッドセル またはフィールドボックス をポイントします。

      単一のフィールドの場合、テキストの上に編集可能なボックスが表示されます。ボックスの横にフィールド名が表示されます。

      ドキュメント画像上の単一のフィールド。

      テーブルフィールドの場合、値が抽出されると、グリッドセル内のテキストがボックスで囲まれて表示されます。

      抽出されたフィールド値を示すツールヒント。

    2. フィールドのツールヒントに表示される値を確認します。
    3. 確認するフィールドごとに手順 1 と 2 を繰り返します。

    ドキュメント画像のフィールドを編集する

    ドキュメント画像のフィールドを編集して、正しい情報が抽出されていることを確認します。

    始める前に

    このタスクについて

    次の手順を使用して、ドキュメント画像の推奨事項を編集してフィールドに変更します。ドキュメントインテリジェンス (DocIntel) によって検出されたテキストは、ボックスで囲まれて表示されます。

    手順

    1. ドキュメント画像で、編集する テキストボックスまたは グリッドセルを選択します。
      ダイアログボックスが表示され、関連フィールドが表示されます。
    2. テキストボックスに値を入力するか、リストから別の推奨事項を選択します。

      ドキュメント画像から開いたテーブルフィールドのダイアログボックス。

    3. [保存] を選択します。