TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025076332
公報種別公開特許公報(A)
公開日2025-05-15
出願番号2024181408
出願日2024-10-17
発明の名称対象認識装置、対象認識方法及びコンピュータ読み取り可能な記憶媒体
出願人富士通株式会社
代理人弁理士法人ITOH
主分類G06T 7/00 20170101AFI20250508BHJP(計算;計数)
要約【課題】対象認識装置、対象認識方法及びコンピュータ読み取り可能な記憶媒体を提供する。
【解決手段】該対象認識装置は、ビデオセグメントに含まれる複数のフレームのうちの各フレームの認識すべき対象に関する特徴を抽出する特徴抽出部と、該複数のフレームのうちの各フレームの認識すべき対象に関する品質を推定する品質推定部と、該複数のフレームの品質に基づいて該ビデオセグメントを複数のサブセグメントに分割する分割部と、該複数のサブセグメントのうちの各サブセグメントの品質が第1の所定閾値以上であるフレームの特徴に基づいて、該ビデオセグメントの認識結果を取得する対象認識部と、を含む。
【選択図】図1

特許請求の範囲【請求項1】
ビデオセグメントに含まれる複数のフレームのうちの各フレームの認識すべき対象に関する特徴を抽出する特徴抽出部と、
前記複数のフレームのうちの各フレームの認識すべき対象に関する品質を推定する品質推定部と、
前記複数のフレームの品質に基づいて前記ビデオセグメントを複数のサブセグメントに分割する分割部と、
前記複数のサブセグメントのうちの各サブセグメントの品質が第1の所定閾値以上であるフレームの特徴に基づいて、前記ビデオセグメントの認識結果を取得する対象認識部と、を含む、対象認識装置。
続きを表示(約 1,600 文字)【請求項2】
前記ビデオセグメントの認識結果を取得することは、
前記複数のサブセグメントのうちの各サブセグメントについて、該サブセグメントに含まれる品質が前記第1の所定閾値以上であるフレームの特徴に基づいて、前記認識すべき対象を認識し、該サブセグメントの認識結果を取得することと、
前記複数のサブセグメントの認識結果に基づいて、前記ビデオセグメントの認識結果を決定することと、を含む、請求項1に記載の対象認識装置。
【請求項3】
前記分割部は、前記複数のフレームの品質を表す品質曲線の極小値に対応するフレームを分割点として決定し、前記分割点に基づいて前記ビデオセグメントを複数のサブセグメントに分割する、請求項2に記載の対象認識装置。
【請求項4】
前記分割部は、前記分割点から、
相互の間隔が第3の所定閾値以下である2つの隣接する分割点のうちの小さいフレーム番号に対応する分割点、及び/又は、
第2の所定閾値以上である極小値に対応する分割点を除去する、請求項3に記載の対象認識装置。
【請求項5】
前記特徴抽出部は、予め訓練されたモデルの特徴抽出層を用いて前記特徴を抽出し、
前記品質推定部は、前記予め訓練されたモデルの品質推定層を用いて前記品質を推定し、
前記予め訓練されたモデルは、目標対象の正解値及び品質の正解値がラベル付けされた訓練画像セットを用いてモデルを共同訓練することによって得られる、請求項1に記載の対象認識装置。
【請求項6】
前記対象認識部は、
前記複数のサブセグメントのうちの各サブセグメントについて、該サブセグメントに含まれるフレームのうちの品質が前記第1の所定閾値以上である複数のフレームの特徴の平均値を該サブセグメントの特徴として取得し、或いは、該サブセグメントに含まれるフレームのうちの品質が前記第1の所定閾値以上である複数のフレームのうちの各フレームの品質に基づいて該フレームの特徴に対して重みを設定し、重みが設定された前記複数のフレームの特徴の平均値を該サブセグメントの特徴として取得し、
該サブセグメントの特徴に基づいて前記認識すべき対象を認識し、該サブセグメントの認識結果を取得する、請求項2に記載の対象認識装置。
【請求項7】
該サブセグメントの特徴に基づいて前記認識すべき対象を認識することは、該サブセグメントの特徴と予め設定されたデータベースにおける特徴とを比較し、比較結果に基づいて前記認識すべき対象を認識することを含み、
前記対象認識装置は、サブセグメントの認識結果に基づいて、前記サブセグメントの特徴を前記予め設定されたデータベースに記憶する、請求項6に記載の対象認識装置。
【請求項8】
前記ビデオセグメントは、リアルタイムに撮影されたビデオから軌跡抽出方法を用いてリアルタイムに抽出される、請求項1乃至7の何れかに記載の対象認識装置。
【請求項9】
ビデオセグメントに含まれる複数のフレームのうちの各フレームの認識すべき対象に関する特徴を抽出するステップと、
前記複数のフレームのうちの各フレームの認識すべき対象に関する品質を推定するステップと、
前記複数のフレームの品質に基づいて前記ビデオセグメントを複数のサブセグメントに分割するステップと、
前記複数のサブセグメントのうちの各サブセグメントの品質が第1の所定閾値以上であるフレームの特徴に基づいて、前記ビデオセグメントの認識結果を取得するステップと、を含む、対象認識方法。
【請求項10】
命令が記憶されているコンピュータ読み取り可能な記憶媒体であって、前記命令がコンピュータにより実行される際に、前記コンピュータに請求項9に記載の対象認識方法を実行させる、記憶媒体。

発明の詳細な説明【技術分野】
【0001】
本開示は、対象認識の分野に関し、具体的には、対象認識装置、対象認識方法及びコンピュータ読み取り可能な記憶媒体に関する。
続きを表示(約 1,900 文字)【背景技術】
【0002】
情報化時代の全面的な発展に伴い、対象(例えば、人、動物、物体など)を認識する技術の応用範囲は益々広くなっている。
【発明の概要】
【発明が解決しようとする課題】
【0003】
以下は、本開示の態様を基本的に理解させるために、本開示の簡単な概要を説明する。なお、この簡単な概要は、本開示を網羅的な概要ではなく、本開示のポイント又は重要な部分を意図的に特定するものではなく、本開示の範囲を意図的に限定するものではなく、後述するより詳細的な説明の前文として、単なる概念を簡単な形で説明することを目的とする。
【0004】
本開示は、改良された対象認識装置、対象認識方法及びコンピュータ読み取り可能な記憶媒体を提供することを目的とする。
【課題を解決するための手段】
【0005】
本開示の1つの態様では、ビデオセグメントに含まれる複数のフレームのうちの各フレームの認識すべき対象に関する特徴を抽出する特徴抽出部と、前記複数のフレームのうちの各フレームの認識すべき対象に関する品質を推定する品質推定部と、前記複数のフレームの品質に基づいて前記ビデオセグメントを複数のサブセグメントに分割する分割部と、前記複数のサブセグメントのうちの各サブセグメントの品質が第1の所定閾値以上であるフレームの特徴に基づいて、前記ビデオセグメントの認識結果を取得する対象認識部と、を含む、対象認識装置を提供する。
【0006】
本開示のもう1つの態様では、ビデオセグメントに含まれる複数のフレームのうちの各フレームの認識すべき対象に関する特徴を抽出するステップと、前記複数のフレームのうちの各フレームの認識すべき対象に関する品質を推定するステップと、前記複数のフレームの品質に基づいて前記ビデオセグメントを複数のサブセグメントに分割するステップと、前記複数のサブセグメントのうちの各サブセグメントの品質が第1の所定閾値以上であるフレームの特徴に基づいて、前記ビデオセグメントの認識結果を取得するステップと、を含む、対象認識方法を提供する。
【0007】
本開示の他の態様では、上記の本開示の方法を実現するためのコンピュータプログラムコード及びコンピュータプログラム製品、並びに上記の本開示の方法を実現するためのコンピュータプログラムコードが記録されているコンピュータ読み取り可能な記憶媒体をさらに提供する。
【0008】
以下は、本開示の実施例の他の態様を説明し、特に本開示の好ましい実施例を詳細に説明するが、本開示はこれらの実施例に限定されない。
【図面の簡単な説明】
【0009】
本開示の原理及び利点を理解させるために、図面を参照しながら本開示の各実施例を説明する。全ての図面において、同一又は類似の符号で同一又は類似の構成部を示している。ここで説明される図面は、本開示の好ましい実施例を例示し、本開示の原理及び利点を解釈するためのものであり、全ての可能な実施例ではなく、本開示の範囲を限定するものではない。
本開示の実施例に係る対象認識装置の機能的構成の一例を示すブロック図である。
図2A及び図2Bは質量曲線の一例を示す図である。
図2A及び図2Bは質量曲線の一例を示す図である。
図3A乃至図3Cはサブセグメントの分割の一例を示す概略図である。
図3A乃至図3Cはサブセグメントの分割の一例を示す概略図である。
図3A乃至図3Cはサブセグメントの分割の一例を示す概略図である。
対象認識の一例を示す概略図である。
対象認識装置に適用可能なモデルの訓練プロセスの一例を示す概略図である。
本開示に係る技術と従来技術との比較の一例を示す図である。
本開示の実施例に係る対象認識方法の流れの一例を示すフローチャートである。
本開示の実施例に適用可能なパーソナルコンピュータの例示的な構成を示すブロック図である。
【発明を実施するための形態】
【0010】
以下、図面を参照しながら本開示の例示的な実施例を詳細に説明する。説明の便宜上、明細書には実際の実施形態の全ての特徴が示されていない。なお、実際に実施する際に、開発者の具体的な目標を実現するために、特定の実施形態を変更してもよい、例えばシステム及び業務に関する制限条件に応じて実施形態を変更してもよい。また、開発作業が非常に複雑であり、且つ時間がかかるが、本公開の当業者にとって、この開発作業は単なる例の作業である。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

富士通株式会社
電源装置
1か月前
富士通株式会社
光伝送装置
10日前
富士通株式会社
画像生成方法
2か月前
富士通株式会社
車線区分装置及び方法
1か月前
富士通株式会社
商品棚の検出装置及び方法
1か月前
富士通株式会社
商品状態検出装置及び方法
1か月前
富士通株式会社
量子デバイス上の誤り訂正
25日前
富士通株式会社
キャッシュメモリ搭載演算装置
1か月前
富士通株式会社
光受信装置及び光伝送システム
17日前
富士通株式会社
評価プログラム、方法、及び装置
2か月前
富士通株式会社
伝送路監視装置及び伝送路監視方法
1か月前
富士通株式会社
人工知能ベースのサステナブル材料設計
20日前
富士通株式会社
情報処理装置,プログラムおよび制御方法
1か月前
富士通株式会社
管理装置、管理方法および管理プログラム
3日前
富士通株式会社
分子動力学計算プログラム、方法、及び装置
1か月前
富士通株式会社
予測プログラム、予測方法及び情報処理装置
2か月前
富士通株式会社
推定プログラム、推定方法及び情報処理装置
26日前
富士通株式会社
ホモグラフィの取得装置、方法及び電子機器
4日前
富士通株式会社
因果関係分析方法及び因果関係分析プログラム
12日前
富士通株式会社
方策学習装置、方策学習方法及び通信システム
2か月前
富士通株式会社
プログラム、情報処理方法および情報処理装置
2か月前
富士通株式会社
光伝送装置、光伝送方法、及び光伝送システム
26日前
富士通株式会社
機械学習アプローチを用いたラマンポンプ設計
1か月前
富士通株式会社
演算プログラム、演算方法、および情報処理装置
1か月前
富士通株式会社
演算プログラム、演算方法、および情報処理装置
1か月前
富士通株式会社
プログラム、データ処理装置及びデータ処理方法
1か月前
富士通株式会社
プログラム、データ処理方法およびデータ処理装置
20日前
富士通株式会社
情報処理プログラム、情報処理方法及び情報処理装置
2か月前
富士通株式会社
情報処理プログラム、情報処理方法、および管理装置
1か月前
富士通株式会社
ログ管理装置、ログ管理方法およびログ管理プログラム
18日前
富士通株式会社
強化学習プログラム、強化学習方法および情報処理装置
11日前
富士通株式会社
情報処理プログラム、情報処理方法および情報処理装置
18日前
富士通株式会社
メモリ駆動装置、光伝送システム、及びメモリ駆動方法
16日前
富士通株式会社
情報処理プログラム、情報処理方法及び情報処理システム
2か月前
富士通株式会社
情報処理プログラム、情報処理方法、および情報処理装置
2か月前
富士通株式会社
画像に基づいて視程値を計算する装置、方法及び電子機器
4日前
続きを見る