TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025117234
公報種別公開特許公報(A)
公開日2025-08-12
出願番号2024011971
出願日2024-01-30
発明の名称情報処理システム、情報処理方法、及び情報処理プログラム
出願人シャープ株式会社
代理人個人,個人,個人
主分類G06V 30/412 20220101AFI20250804BHJP(計算;計数)
要約【課題】形式の異なる書類を適切に判別するとともに文字認識精度を向上させることが可能な情報処理システム、情報処理方法、及び情報処理プログラムを提供する。
【解決手段】画像処理装置1は、書類の画像データに基づいて、書類に含まれる文字列を囲む文字列矩形を取得する取得処理部111と、書類のサイズに対応する領域における文字列矩形の配置密度に基づいて、書類の形式を判定する判定処理部112と、判定処理部112の判定結果に応じた動作モードにより、画像データから書類に含まれる所定の項目に対応する対象文字を抽出する抽出処理部113と、を備える。
【選択図】図1
特許請求の範囲【請求項1】
書類の画像データに基づいて、当該書類に含まれる文字列を囲む文字列矩形を取得する取得処理部と、
前記書類のサイズに対応する領域における前記文字列矩形の配置密度に基づいて、当該書類の形式を判定する判定処理部と、
前記判定処理部の判定結果に応じた動作モードにより、前記画像データから前記書類に含まれる所定の項目に対応する対象文字を抽出する抽出処理部と、
を備える情報処理システム。
続きを表示(約 1,500 文字)【請求項2】
前記判定処理部は、前記領域の縦方向における前記文字列矩形の配置密度に基づいて、当該書類がレシート形式の書類であるか又は前記レシート形式以外の一般帳票形式の書類であるかを判定する、
請求項1に記載の情報処理システム。
【請求項3】
前記判定処理部は、
前記領域の縦方向の基準高さに対する、複数の前記文字列矩形のそれぞれの縦方向の高さを合計した合計高さを前記配置密度として算出し、
前記配置密度が閾値以上の場合に前記書類を前記レシート形式の書類と判定し、前記配置密度が閾値未満の場合に前記書類を前記一般帳票形式の書類と判定する、
請求項2に記載の情報処理システム。
【請求項4】
前記判定処理部は、
前記領域の縦方向の基準高さに対する、複数の前記文字列矩形のそれぞれの縦方向の高さを合計した合計高さを前記配置密度として算出し、
前記配置密度が閾値未満の場合に前記書類を前記一般帳票形式の書類と判定し、
前記配置密度が閾値以上であって、前記領域の縦横比が所定値に一致しかつ前記領域の横方向の推定文字数が所定文字数以上の場合に、前記書類を前記一般帳票形式の書類と判定し、
前記配置密度が閾値以上であって前記領域の縦横比が前記所定値に一致しない場合、又は、前記配置密度が閾値以上であって前記推定文字数が前記所定文字数未満の場合に、前記書類を前記レシート形式の書類と判定する、
請求項2に記載の情報処理システム。
【請求項5】
前記判定処理部は、複数の前記文字列矩形のそれぞれの水平方向における位置座標の最大値及び最小値と、垂直方向における位置座標の最大値及び最小値に基づいて、前記領域の縦方向及び横方向のサイズを推定する、
請求項1に記載の情報処理システム。
【請求項6】
前記画像データのサイズと、複数の前記文字列矩形の配置位置から推定される画角サイズとの差分に基づいて、前記領域を決定する、
請求項1に記載の情報処理システム。
【請求項7】
前記判定処理部は、前記領域の最上位置に配置される第1文字列矩形から前記領域の最下位置に配置される第2文字列矩形までの長さから、前記第1文字列矩形と前記第2文字列矩形との間に配置される非文字列矩形の高さを除外した長さを前記基準高さとして算出する、
請求項3又は4に記載の情報処理システム。
【請求項8】
前記判定処理部は、前記領域を横方向に分割した分割領域に含まれる複数の前記文字列矩形に対応する前記配置密度を算出する、
請求項1に記載の情報処理システム。
【請求項9】
書類の画像データに基づいて、当該書類に含まれる文字列を囲む文字列矩形を取得することと、
前記書類のサイズに対応する領域における前記文字列矩形の配置密度に基づいて、当該書類の形式を判定することと、
判定結果に応じた動作モードにより、前記画像データから前記書類に含まれる所定の項目に対応する対象文字を抽出することと、
を一又は複数のプロセッサーが実行する情報処理方法。
【請求項10】
書類の画像データに基づいて、当該書類に含まれる文字列を囲む文字列矩形を取得することと、
前記書類のサイズに対応する領域における前記文字列矩形の配置密度に基づいて、当該書類の形式を判定することと、
判定結果に応じた動作モードにより、前記画像データから前記書類に含まれる所定の項目に対応する対象文字を抽出することと、
を一又は複数のプロセッサーに実行させるための情報処理プログラム。

発明の詳細な説明【技術分野】
【0001】
本開示は、画像データに対して文字認識等の画像処理を実行する情報処理システム、情報処理方法、及び情報処理プログラムに関する。
続きを表示(約 3,100 文字)【背景技術】
【0002】
従来、帳票等の書類の画像データから文字列を抽出する技術が知られている。例えば、イメージデータの書類の種別を判別し、判別した種別に関連付けられた文字認識エンジンを用いてイメージデータの文字認識処理を実行する技術が知られている(例えば特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
特開2020-181369号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかし、従来の技術では、前記書類が、認識精度を高める対策が施されたものであるかどうか、帳票IDなど帳票を特定できる識別子が存在するかどうか、などの特徴に基づいて書類の種別を判別しているため、例えばレシートなど比較的自由なレイアウトの形式の書類の場合、当該書類の種別を適切に判別できず文字認識精度が低下する問題が生じる。
【0005】
本開示の目的は、形式の異なる書類を適切に判別するとともに文字認識精度を向上させることが可能な情報処理システム、情報処理方法、及び情報処理プログラムを提供することにある。
【課題を解決するための手段】
【0006】
本開示の一の態様に係る情報処理システムは、書類の画像データに基づいて、当該書類に含まれる文字列を囲む文字列矩形を取得する取得処理部と、前記書類のサイズに対応する領域における前記文字列矩形の配置密度に基づいて、当該書類の形式を判定する判定処理部と、前記判定処理部の判定結果に応じた動作モードにより、前記画像データから前記書類に含まれる所定の項目に対応する対象文字を抽出する抽出処理部と、を備える。
【0007】
本開示の他の態様に係る情報処理方法は、書類の画像データに基づいて、当該書類に含まれる文字列を囲む文字列矩形を取得することと、前記書類のサイズに対応する領域における前記文字列矩形の配置密度に基づいて、当該書類の形式を判定することと、判定結果に応じた動作モードにより、前記画像データから前記書類に含まれる所定の項目に対応する対象文字を抽出することと、を一又は複数のプロセッサーが実行する情報処理方法である。
【0008】
本開示の他の態様に係る情報処理プログラムは、書類の画像データに基づいて、当該書類に含まれる文字列を囲む文字列矩形を取得することと、前記書類のサイズに対応する領域における前記文字列矩形の配置密度に基づいて、当該書類の形式を判定することと、判定結果に応じた動作モードにより、前記画像データから前記書類に含まれる所定の項目に対応する対象文字を抽出することと、を一又は複数のプロセッサーに実行させるための情報処理プログラムである。
【発明の効果】
【0009】
本開示によれば、形式の異なる書類を適切に判別するとともに文字認識精度を向上させることが可能な情報処理システム、情報処理方法、及び情報処理プログラムを提供することができる。
【図面の簡単な説明】
【0010】
図1は、本開示の実施形態に係る画像処理システムの構成を示す機能ブロック図である。
図2は、本開示の実施形態に係る帳票に含まれる見積書の一例を示す図である。
図3は、本開示の実施形態に係る帳票に含まれるレシートの一例を示す図である。
図4は、本開示の実施形態に係る画像処理システムで実行される帳票画像処理の手順の一例を説明するためのフローチャートである。
図5Aは、本開示の実施形態に係る画像処理システムの文字認識処理において抽出される文字列を登録した文字列リストの一例を示す図である。
図5Bは、本開示の実施形態に係る一般帳票の画像データにおける文字認識処理の一例を示す図である。
図6は、本開示の実施形態に係るレシートの画像データにおける文字認識処理の一例を示す図である。
図7は、本開示の実施形態に係る画像処理システムで実行される帳票判定処理の手順の一例を説明するためのフローチャートである。
図8は、本開示の実施形態に係る帳票判定処理の具体例を示す図である。
図9は、本開示の実施形態に係る帳票判定処理の具体例を示す図である。
図10は、本開示の実施形態に係る帳票判定処理の具体例を示す図である。
図11は、本開示の実施形態に係る帳票判定処理の具体例を示す図である。
図12は、本開示の実施形態に係る帳票判定処理の具体例を示す図である。
図13は、本開示の実施形態に係る画像処理システムで実行される動作モード設定処理の手順の一例を説明するためのフローチャートである。
図14は、本開示の実施形態に係る動作モード設定処理の具体例を示す図である。
図15は、本開示の実施形態に係る画像処理システムで実行される動作モード設定処理の手順の一例を説明するためのフローチャートである。
図16は、本開示の実施形態に係る画像処理システムで実行される動作モード設定処理の手順の一例を説明するためのフローチャートである。
図17は、本開示の実施形態に係る画像処理システムで実行される日付抽出処理の手順の一例を説明するためのフローチャートである。
図18は、本開示の実施形態に係る日付抽出処理の具体例を示す図である。
図19は、本開示の実施形態に係る日付抽出処理の具体例を示す図である。
図20は、本開示の実施形態に係る日付抽出処理の具体例を示す図である。
図21は、本開示の実施形態に係る日付抽出処理の具体例を示す図である。
図22は、本開示の実施形態に係る日付抽出処理の具体例を示す図である。
図23は、本開示の実施形態に係る日付抽出処理の具体例を示す図である。
図24は、本開示の実施形態に係る日付抽出処理の具体例を示す図である。
図25は、本開示の実施形態に係る日付抽出処理の具体例を示す図である。
図26Aは、本開示の実施形態に係る日付抽出処理の具体例を示す図である。
図26Bは、本開示の実施形態に係る日付抽出処理の具体例を示す図である。
図27は、本開示の実施形態に係る日付抽出処理の具体例を示す図である。
図28は、本開示の実施形態に係る日付抽出処理の具体例を示す図である。
図29は、本開示の実施形態に係る画像処理システムで実行される金額抽出処理の手順の一例を説明するためのフローチャートである。
図30は、本開示の実施形態に係る金額抽出処理の具体例を示す図である。
図31は、本開示の実施形態に係る画像処理システムで実行される金額抽出処理の手順の一例を説明するためのフローチャートである。
図32は、本開示の実施形態に係る画像処理システムで実行される金額抽出処理の手順の一例を説明するためのフローチャートである。
図33は、本開示の実施形態に係る画像処理システムで実行される金額抽出処理の手順の一例を説明するためのフローチャートである。
図34は、本開示の実施形態に係る金額抽出処理の具体例を示す図である。
図35は、本開示の実施形態に係る帳票画像処理の抽出結果を示す図である。
図36は、本開示の実施形態に係る帳票画像処理の抽出結果を示す図である。
【発明を実施するための形態】
(【0011】以降は省略されています)

この特許をJ-PlatPat(特許庁公式サイト)で参照する

関連特許