描画ツールを使用したフィールドの抽出

  • リリースバージョン: Yokohama
  • 更新日 2025年01月30日
  • 所要時間:9分
  • 描画ツールを使用して、ドキュメント画像上の テキストと 表から情報を直接抽出します。

    描画ツールの概要

    処理されたドキュメントを ドキュメントインテリジェンス (DocIntel) ワークスペースで表示するときに、描画ツールを使用して、ドキュメント画像からフィールドを抽出して確認できます。

    特に、推奨事項がまだない場合や推奨事項が正しくない場合、描画ツールは、抽出するドキュメントの特定の領域を選択するのに役立ちます。

    抽出されたテーブルフィールドは、テーブルの上のグリッドに既に表示されているはずです。抽出された単一フィールドは、テキスト上にラベル付きのボックスとして表示されます。 抽出されたフィールドをグリッド またはボックス から直接確認し、必要に応じて調整できます。テーブルフィールドが空であるかグリッドがない場合は、テーブル上に 1 つ以上のグリッドを作成してフィールドを抽出できます。

    描画ツールは、ドキュメント画像上のテーブル上にグリッドを作成します。

    描画ツールを使用した 1 つのフィールドの抽出

    描画ツールを使用して、ドキュメント画像から 1 つのフィールドを直接抽出します。

    始める前に

    必要なロール:sn_docintel.extraction_agent

    このタスクについて

    描画ツールを使用してドキュメントから単一のフィールドを抽出するには、次の手順に従います。抽出されたデータは、ドキュメントフィールドパネルの関連フィールドに入力するために使用されます。

    フィールドが自動入力されている場合、抽出されたテキストの上にボックスが既に表示されています。必要に応じてフィールドを調整できます。

    手順

    1. ドキュメントフィールドパネルで、[ フィールド] を展開します
    2. フィールドを選択します。

      描画ツールアイコン ( 描画ツールアイコン) は、ドキュメントコントロールツールバーで有効になっています。

      フィールドが既に自動入力されていて、フィールドの上にボックスが表示されている場合、または既にボックスを描画している場合は、手順 5 に進みます。

    3. 描画ツールアイコン(描画ツールアイコン)を選択します。
    4. 抽出するドキュメント画像上の領域にボックスを描画します。
      テキストの上に編集可能なボックスが表示されます。フィールド名がボックスの横に表示されます。ボックス内の抽出されたテキストがハイライト表示されます。
      図 : 1. 1 つのフィールドに描画されたボックス
      日付フィールド値を抽出するためにドキュメント上に描画されるボックス。

      抽出されたテキストは、ドキュメントフィールドパネルの関連フィールドに入力されます。

      ヒント:
      入力されたフィールドで Enter キーまたは Return キーを押すと、次のフィールドに移動して新しいボックスが描画されます。
    5. オプション: 必要に応じてボックスを調整します。
      オプション説明
      ボックスのサイズを変更する

      ボックスを選択します。ボックスの端または角を目的の位置にドラッグします。

      ボックス内の更新されたテキストが抽出され、ドキュメントフィールドパネルの関連フィールドに入力されます。

      ボックスを削除

      ボックスを削除アイコン ( ボックスを削除アイコン ) を選択します。

      ボックスが削除され、抽出された値がフィールドから削除されます。

      別のフィールドに抽出

      ボックスの横にあるフィールド名を選択し、リストから別のオプションを選択します。

    6. オプション: フィールドに変更を入力して、抽出されたテキストを編集します。
      ドキュメントインテリジェンス (DocIntel) 選択した領域内のすべてのテキストを検出できない場合があります。この場合、フィールドに情報を直接入力する必要があります。

    描画ツールを使用したテーブルの抽出

    描画ツールを使用して、ドキュメント画像から直接テーブルを抽出します。

    始める前に

    必要なロール:sn_docintel.extraction_agent

    このタスクについて

    描画ツールを使用してドキュメントからテーブルを抽出するには、次の手順に従います。抽出されたデータは、関連するテーブルフィールドに入力するために使用されます。

    テーブルフィールドが自動入力されている場合、抽出されたフィールドに基づいて描画ツールグリッドが既に使用可能です。必要に応じてフィールドを調整できます。詳細については、「描画ツールのグリッドを調整する」を参照してください。

    ドキュメントのページ全体で、テーブルの複数のセクションを選択できます。

    手順

    1. ドキュメントフィールドパネルで、[テーブル] セクションを展開します。
      [テーブル] セクションには、テーブル フィールドグループにアサインされたフィールドのみが表示されます。
    2. [テーブル] セクションでテーブルを選択します。

      テーブルパネルが表示され、[描画 ツール ] アイコン ( 描画ツールアイコン。は、ドキュメントコントロールツールバーで有効になっています。

      テーブルフィールドが既に自動入力されていて、グリッドがテーブル上に表示されている場合、または既にグリッドを描画している場合は、手順 5 に進みます。

      ヒント:
      必要に応じて、[テーブルパネルを折りたたむ] アイコン ([ テーブルパネルを折りたたむ] アイコン) を使用して、テーブルパネルを折りたたみます。
    3. 描画 ツール アイコン( 描画ツールアイコン)。
    4. 抽出するドキュメント画像上の領域にボックスを描画します。
      ヒント:
      選択エリアにテーブルのヘッダー行を含めます。

      編集可能なグリッドがテーブルの上に表示されます。グリッドは、選択した領域のテーブルセルを定義します。グリッドの行番号は、[テーブル] パネルの行に対応しています。

      セル内のテキストは、テーブルフィールドに抽出される前に、点線のボックスで囲まれて表示されます。抽出されると、実線のボックスに表示されます。

      ドキュメント画像上の表の上に表示されるツールグリッドを描画します。

    5. 必要に応じてグリッドを調整します。

      詳細については、「描画ツールのグリッドを調整する」を参照してください。

    6. オプション: ドキュメントの同じページまたは別のページでテーブルの別のセクションを選択するには:
      1. 描画 ツール アイコン( 描画ツールアイコン)。
      2. 抽出するドキュメント画像の他の領域にボックスを描画します。
        注:
        既存のグリッドの上に新しいグリッドを描画することはできません。
        テーブル名の横にあるグリッド番号には、更新されたグリッド番号が表示されます。たとえば、「品目 (2/2)」は、[品目] テーブルのフィールドを抽出するために使用される 2 つのグリッドのうちの 2 番目であることを示します。
      3. 必要に応じてグリッドを調整します。
    7. オプション: グリッドを非表示にするには、[グリッドを表示/非表示] アイコン ([グリッドを表示/非表示] アイコン) を選択します。

      部分的に透明なボックスは、ドキュメント上の非表示のグリッドの位置を示します。

      非表示のグリッドまたは [グリッドを表示/非表示 (Hide/Show the grid(s))] アイコンを選択してグリッドを表示します。

    8. 、データを抽出します
      • [データの抽出] を選択します。

        データがまだ抽出されていない場合に、このボタンが表示されます。

      • [ フィールドを更新] を選択します。

        このボタンは、テーブルフィールドが既に入力されており、変更を行ってその一部が上書きされた場合に表示されます。

        [ フィールドを更新 ] ボタンには、更新するフィールドの数が表示されます。

      グリッド内のデータが抽出され、関連するテーブルフィールドに入力するために使用されます。

      グリッドに空のセルまたは欠落している列がある場合、関連するテーブルフィールドは ドキュメントで [欠落] に設定されます。

    描画ツールのグリッドを調整する

    描画ツールのグリッドを調整して、ドキュメント画像から抽出する情報に合わせます。

    始める前に

    • これらの手順は、ドキュメント画像に描画ツールグリッドがあるテーブルに適用されます。詳細については、「描画ツールを使用したテーブルの抽出」を参照してください。
    • 必要なロール:sn_docintel.extraction_agent

    このタスクについて

    グリッドを変更するには、次の手順に従います。その後、関連するテーブルフィールドの更新を抽出できます。

    手順

    1. ドキュメント画像で、変更するグリッドを選択します。

      ドキュメントに複数のグリッドがある場合は、1 つだけに編集ツールが表示されます。もう一方のグリッドは、編集用に選択するまでオーバーレイとして表示されます。

      描画モードグリッドを調整するためのツール。

    2. 必要に応じてグリッドを調整します。

      調整は自動保存されます。

      以前の抽出を変更する調整は、セルの隅に表示されます。

      セル内のテキストが既に抽出されている場合は、実線で囲まれて表示されます。まだ抽出されていない場合は、点線のボックスで表示されます。

      オプション説明
      グリッドの移動

      移動アイコン ( 移動アイコン) を目的の位置にドラッグします。

      列ヘッダーの変更

      列ヘッダーを選択し、テーブルフィールドでデータの抽出先の列を選択します。

      最初の行をヘッダー行にする

      行ヘッダーを選択し、[ これはヘッダー行です ] チェックボックスをオンにします。

      列または行の境界線を移動する

      境界線を目的の位置にドラッグします。

      新しい列または行を追加

      グリッドの外側の境界線に移動し、線の追加アイコン (線の追加アイコン) を選択します。

      線を追加すると、影響を受けるセルが分割され、個別のフィールドに抽出できるようになります。

      列または行の境界線を削除する

      グリッドの外側の境界線の端にある [線の削除] アイコン ( [線の削除] アイコン)を選択します。

      線を削除すると、影響を受けるセルが結合され、同じフィールドに抽出できるようになります。

      グリッドを削除

      [グリッドを削除] アイコン ( [グリッドを削除] アイコン) を選択します。

      このアクションではグリッドのみが削除され、抽出されたデータは削除されません。

      テーブルの列または行を無視する
      1. 列または行の見出しを選択します。
      2. [ この列/行を抽出しない ] チェックボックスをオンにします。
      3. [Save (保存)] をクリックする。

    ドキュメント画像のフィールドを確認する

    描画ツールを使用して、文書の画像パネルから直接オートフィルされたフィールドを確認します。

    始める前に

    手順

    1. ドキュメント画像で、確認するグリッド セル またはフィールド ボックス をポイントします。

      単一のフィールドの場合、テキストの上に編集可能なボックスが表示されます。フィールド名がボックスの横に表示されます。

      ドキュメント画像上の単一フィールド。

      テーブルフィールドの場合、値が抽出されると、グリッドセル内のテキストがボックスで囲まれて表示されます。

      抽出されたフィールド値を示すツールヒント。

    2. フィールドのツールヒントに表示される値を確認します。
    3. 確認するフィールドごとに手順 1 と 2 を繰り返します。

    ドキュメント画像のフィールドを編集する

    ドキュメント画像のフィールドを編集して、正しい情報が抽出されていることを確認します。

    始める前に

    このタスクについて

    ドキュメント画像の推奨事項を編集してフィールドを変更するには、次の手順に従います。ドキュメントインテリジェンス (DocIntel)によって検出されたテキストは、ボックスで囲まれて表示されます。

    手順

    1. ドキュメント画像で、編集する テキストボックスまたは グリッドセルを選択します。
      ダイアログボックスが表示され、関連フィールドが表示されます。
    2. テキストボックスに値を入力するか、リストから別の推奨事項を選択します。

      ドキュメント画像から開いたテーブルフィールドのダイアログボックス。

    3. [Save (保存)] をクリックする。