TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
公開番号
2025122675
公報種別
公開特許公報(A)
公開日
2025-08-22
出願番号
2024018226
出願日
2024-02-09
発明の名称
画像認識装置、およびその方法
出願人
Arithmer株式会社
代理人
主分類
G06V
30/194 20220101AFI20250815BHJP(計算;計数)
要約
【課題】画像認識を精度よく行う。
【解決手段】イメージファイルを読み取る複数のAI画像読み取り装置と、前記イメージファイルの画像読み取り機能を持った大規模言語モデルとを備え、前記イメージファイルを前記複数の読み取り装置で読み取った結果の複数の出力と、前記イメージファイルと、前記大規模言語モデルでの出力フォーマット指示とを入力して前記大規模言語モデル内で整合性を取って、前記イメージファイルの画像認識結果を前記大規模言語モデルから前記指示通りに出力する画像認識装置。
【選択図】図1
特許請求の範囲
【請求項1】
イメージファイルを読み取る複数のAI画像読み取り装置と、
前記イメージファイルの画像読み取り機能を持った大規模言語モデルと、
を備え、
前記イメージファイルを前記複数の読み取り装置で読み取った結果の複数の出力と、前記イメージファイルと、前記大規模言語モデルでの出力フォーマット指示とを入力して前記大規模言語モデル内で整合性を取って、前記イメージファイルの画像認識結果を前記大規模言語モデルから前記指示通りに出力する画像認識装置。
続きを表示(約 230 文字)
【請求項2】
複数のAI画像読み取り装置で同じイメージファイルを読み取り、読み取った結果を出力するステップと、
画像読み取り機能を持った大規模言語モデルに、前記複数の出力と、前記イメージファイルと、前記大規模言語モデルでの出力フォーマット指示とを入力して、前記大規模言語モデル内で整合性を取るステップと、
前記大規模言語モデルから前記イメージファイルの画像認識結果を前記指示通りに出力するステップと、
を備えた画像認識方法。
発明の詳細な説明
【技術分野】
【0001】
本発明は、画像認識装置、および方法に関する。
続きを表示(約 1,100 文字)
【背景技術】
【0002】
例えば、非特許文献1には、「Google CloudのDocumentAIを使用した請求書のOCR自動化手法と、ChatGPTを組み合わせたOCRデータ正規化及びJsonフォーマット形成の方法について説明しました」と記載されている。
【先行技術文献】
【非特許文献】
【0003】
「請求書OCR自動化: Document AI + ChatGPT API で非構造化データを JSON で出力させる」https://recruit.gmo.jp/engineer/jisedai/blog/automated-invoice-ocr-with-chatgpt-and-documentai/
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、非特許文献1のシステムでは、簡単なフォーマットのOCRは可能だが、複雑なフォーマットで、なおかつ、出力指示する項目名と同じ意味の帳票の項目名が異なって記載されている帳票等のOCRには適していない。
【課題を解決するための手段】
【0005】
イメージファイルを読み取る複数のAI画像読み取り装置と、前記イメージファイルの画像読み取り機能を持った大規模言語モデルとを備え、前記イメージファイルを前記複数の読み取り装置で読み取った結果の複数の出力と、前記イメージファイルと、前記大規模言語モデルでの出力フォーマット指示とを入力して前記大規模言語モデル内で整合性を取って、前記イメージファイルの画像認識結果を前記大規模言語モデルから前記指示通りに出力することを特徴とする。
【発明の効果】
【0006】
本発明によれば、画像認識を精度よく行うことができる。
【図面の簡単な説明】
【0007】
本発明の実施形態に係る画像認識装置10の構成を示す模式図である。
【発明を実施するための形態】
【0008】
(1)画像認識装置の構成
【0009】
図1は本実施形態に係る画像認識装置10の構成を示す模式図である。便宜上、以下の説明において、画像認識の対象は、イメージファイルであるとする。
【0010】
OCR112は、例えば、GoogleドライブのAIを使用したOCRエンジンである。0CR213は、例えば、Microsoft(登録商標)のAIを使用したOCRエンジンである。OCR機能を持ったLLM11は、例えば、GhatGPT4である。
(【0011】以降は省略されています)
この特許をJ-PlatPat(特許庁公式サイト)で参照する
関連特許
個人
裁判のAI化
1か月前
個人
工程設計支援装置
9日前
個人
フラワーコートA
17日前
個人
情報処理システム
1か月前
個人
検査システム
1か月前
個人
介護情報提供システム
24日前
個人
設計支援システム
1か月前
個人
設計支援システム
1か月前
個人
携帯情報端末装置
10日前
個人
不動産売買システム
1か月前
キヤノン電子株式会社
携帯装置
1か月前
個人
結婚相手紹介支援システム
6日前
株式会社サタケ
籾摺・調製設備
1か月前
株式会社カクシン
支援装置
1か月前
個人
アンケート支援システム
19日前
個人
備蓄品の管理方法
1か月前
キヤノン株式会社
情報処理装置
1か月前
キヤノン株式会社
情報処理装置
1か月前
サクサ株式会社
中継装置
1か月前
大阪瓦斯株式会社
住宅設備機器
3日前
個人
ジェスチャーパッドのガイド部材
23日前
サクサ株式会社
中継装置
20日前
株式会社寺岡精工
システム
23日前
ホシデン株式会社
タッチ入力装置
1か月前
個人
リテールレボリューションAIタグ
16日前
株式会社ワコム
電子消去具
1か月前
株式会社アジラ
移動方向推定装置
18日前
キヤノン電子株式会社
名刺管理システム
1か月前
株式会社東芝
電子機器
1か月前
株式会社村田製作所
ラック
5日前
東洋電装株式会社
操作装置
1か月前
東洋電装株式会社
操作装置
1か月前
アスエネ株式会社
排水量管理方法
1か月前
株式会社ゼロワン
ケア支援システム
9日前
株式会社アザース
企業連携システム
24日前
飛鳥興産株式会社
物品買取システム
12日前
続きを見る
他の特許を見る