TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
公開番号
2025128706
公報種別
公開特許公報(A)
公開日
2025-09-03
出願番号
2024025521
出願日
2024-02-22
発明の名称
作業認識装置、作業認識方法およびプログラム
出願人
オムロン株式会社
代理人
弁理士法人深見特許事務所
主分類
G06T
7/00 20170101AFI20250827BHJP(計算;計数)
要約
【課題】カメラの設置場所の自由度が高く、認識精度の高い作業認識装置を提供する。
【解決手段】作業認識装置は、教師データを用いた機械学習を行うことにより学習済モデルを生成する学習部と、学習済モデルを用いて作業種別を認識する認識部とを備える。学習部は、学習用動画の第1単位区間に含まれるフレームに基づいて第1フレーム間差分画像を生成し、第1フレーム間差分画像と、第1単位区間に対して付与された作業種別を示すラベルとを示すデータを教師データとして用いる。認識部は、認識対象動画の第2単位区間に含まれるフレームに基づいて第2フレーム間差分画像を生成し、第2フレーム間差分画像を入力したときの学習済モデルの出力に基づいて、第2単位区間に写る作業者の作業種別を認識する。
【選択図】図1
特許請求の範囲
【請求項1】
作業者の作業種別を認識する作業認識装置であって、
教師データを用いた機械学習を行うことにより学習済モデルを生成する学習部と、
前記学習済モデルを用いて前記作業種別を認識する認識部とを備え、
前記学習部は、
前記作業者の作業現場を撮影することにより得られる学習用動画の第1単位区間に含まれるフレームに基づいて、第1フレーム間差分画像を生成し、
前記第1フレーム間差分画像と、前記第1単位区間に含まれるフレームに対して付与された前記作業種別を示すラベルとを示すデータを前記教師データとして用い、
前記認識部は、
前記作業現場を撮影することにより得られる認識対象動画の第2単位区間に含まれるフレームに基づいて、第2フレーム間差分画像を生成し、
前記第2フレーム間差分画像を入力したときの前記学習済モデルの出力に基づいて、前記第2単位区間に写る前記作業者の前記作業種別を認識する、作業認識装置。
続きを表示(約 2,100 文字)
【請求項2】
前記認識対象動画の各フレームから人を検知する人検知部をさらに備え、
前記認識部は、人が検知されたフレームについてのみ前記作業種別を認識する、請求項1に記載の作業認識装置。
【請求項3】
前記第1単位区間および前記第2単位区間の各々は、連続する2つのフレームを含み、
前記第1フレーム間差分画像は、前記第1単位区間に含まれる前記2つのフレームの差分画像であり、
前記第2フレーム間差分画像は、前記第2単位区間に含まれる前記2つのフレームの差分画像である、請求項1または2に記載の作業認識装置。
【請求項4】
前記第1単位区間および前記第2単位区間の各々は、連続する2つのフレームを含み、
前記第1フレーム間差分画像は、前記第1単位区間に含まれる前記2つのフレームのうちの一方と、前記第1単位区間に含まれる前記2つのフレームの間に挿入される補間フレームとの差分画像であり、
前記第2フレーム間差分画像は、前記第2単位区間に含まれる前記2つのフレームのうちの一方と、前記第2単位区間に含まれる前記2つのフレームの間に挿入される補間フレームとの差分画像である、請求項1または2に記載の作業認識装置。
【請求項5】
前記第1単位区間および前記第2単位区間の各々は、連続する3以上のフレームを含み、
前記第1フレーム間差分画像は、前記第1単位区間に含まれる前記3以上のフレームにおける、最初のフレームと最後のフレームとの差分画像であり、
前記第2フレーム間差分画像は、前記第2単位区間に含まれる前記3以上のフレームにおける、最初のフレームと最後のフレームとの差分画像である、請求項1または2に記載の作業認識装置。
【請求項6】
前記第1単位区間および前記第2単位区間の各々は、連続する4以上のフレームを含み、
前記第1フレーム間差分画像は、前記第1単位区間に含まれる前記4以上のフレームの前半のフレーム群を加重平均することにより得られるフレームと、前記第1単位区間に含まれる前記4以上のフレームの後半のフレーム群を加重平均することにより得られるフレームとの差分画像であり、
前記第2フレーム間差分画像は、前記第2単位区間に含まれる前記4以上のフレームの前半のフレーム群を加重平均することにより得られるフレームと、前記第2単位区間に含まれる前記4以上のフレームの後半のフレーム群を加重平均することにより得られるフレームとの差分画像である、請求項1または2に記載の作業認識装置。
【請求項7】
前記学習部は、Few-shot学習を用いて前記学習済モデルを生成する、請求項1または2に記載の作業認識装置。
【請求項8】
作業者の作業種別を認識する作業認識方法であって、
1以上のプロセッサが教師データを用いた機械学習を行うことにより学習済モデルを生成することと、
前記1以上のプロセッサが前記学習済モデルを用いて前記作業種別を認識することとを備え、
前記学習済モデルを生成することは、
前記作業者の作業現場を撮影することにより得られる学習用動画の第1単位区間に含まれるフレームに基づいて、第1フレーム間差分画像を生成することと、
前記第1フレーム間差分画像と、前記第1単位区間に含まれるフレームに対して付与された前記作業種別を示すラベルとを示すデータを前記教師データとして用いることとを含み、
前記認識することは、
前記作業現場を撮影することにより得られる認識対象動画の第2単位区間に含まれるフレームに基づいて、第2フレーム間差分画像を生成することと、
前記第2フレーム間差分画像を入力したときの前記学習済モデルの出力に基づいて、前記認識対象動画の前記第2単位区間に写る前記作業者の前記作業種別を認識することとを含む、作業認識方法。
【請求項9】
作業者の作業種別を認識する作業認識方法をコンピュータに実行させるプログラムであって、前記作業認識方法は、
教師データを用いた機械学習を行うことにより学習済モデルを生成することと、
前記学習済モデルを用いて前記作業種別を認識することとを備え、
前記学習済モデルを生成することは、
前記作業者の作業現場を撮影することにより得られる学習用動画の第1単位区間に含まれるフレームに基づいて、第1フレーム間差分画像を生成することと、
前記第1フレーム間差分画像と、前記第1単位区間に含まれるフレームに対して付与された前記作業種別を示すラベルとを示すデータを前記教師データとして用いることとを含み、
前記認識することは、
前記作業現場を撮影することにより得られる認識対象動画の第2単位区間に含まれるフレームに基づいて、第2フレーム間差分画像を生成することと、
前記第2フレーム間差分画像を入力したときの前記学習済モデルの出力に基づいて、前記認識対象動画の前記第2単位区間に写る前記作業者の前記作業種別を認識することとを含む、プログラム。
発明の詳細な説明
【技術分野】
【0001】
本開示は、作業認識装置、作業認識方法およびプログラムに関する。
続きを表示(約 1,800 文字)
【背景技術】
【0002】
従来、作業者を撮影することにより得られる動画から作業者の作業種別を認識する技術が開発されている。
【0003】
中国特許出願公開第109409209号明細書(特許文献1)は、人体動画情報を取得するステップと、人体動画情報を前処理して、関節点の位置を示す骨格ノード情報を取得するステップと、骨格ノード情報を行動認識モデルに入力し、行動を識別するステップとを含む方法を開示する。
【0004】
特開2021-67981号公報(特許文献2)は、要素作業情報によって特定された要素作業に関連する作業関連物を撮像した領域を含む画像情報を学習対象データとして用いることで、作業関連物と要素作業との関連性を考慮したモデルを生成する装置を開示する。装置は、モデルに基づいて、対象画像がどの要素作業を行う作業者に係る画像であるかを特定する。
【先行技術文献】
【特許文献】
【0005】
中国特許出願公開第109409209号明細書
特開2021-67981号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
特許文献1に記載の方法は、人体動画情報を前処理して取得された骨格ノード情報に基づいて、人の行動を識別する。そのため、骨格を認識できる程度に人体が写る人体動画情報を生成する必要がある。したがって、人体動画情報を生成するカメラの設置場所が制限される。
【0007】
一方、特許文献2に記載の装置は、骨格ノード情報を抽出することなく、対象画像をモデルに直接入力する。そのため、対象画像を生成するカメラの設置場所が制限されない。しかしながら、対象画像には、作業者だけでなく、作業者の背景も写る。そのため、モデルは、対象画像に写る背景の特徴に基づいて、作業者が写っていない対象画像を、ある特定の要素作業を行う作業者に係る画像として誤って認識し得る。あるいは、モデルは、作業者および背景の特徴に基づいて、作業待ちの状態の作業者が写る対象画像を、ある特定の要素作業を行う作業者に係る画像として誤って認識し得る。
【0008】
本開示は、上記の問題に鑑みてなされたものであり、その目的は、画像を取得するカメラの設置場所の自由度が高く、かつ、認識精度の高い作業認識装置、作業認識方法およびプログラムを提供することである。
【課題を解決するための手段】
【0009】
本開示の一例によれば、作業者の作業種別を認識する作業認識装置は、教師データを用いた機械学習を行うことにより学習済モデルを生成する学習部と、学習済モデルを用いて作業種別を認識する認識部とを備える。学習部は、作業者の作業現場を撮影することにより得られる学習用動画の第1単位区間に含まれるフレームに基づいて、第1フレーム間差分画像を生成する。学習部は、第1のフレーム間差分画像と、第1単位区間に含まれるフレームに対して付与された作業種別を示すラベルとを示すデータを教師データとして用いる。認識部は、作業現場を撮影することにより得られる認識対象動画の第2単位区間に含まれるフレームに基づいて、第2フレーム間差分画像を生成する。認識部は、第2フレーム間差分画像を入力したときの学習済モデルの出力に基づいて、認識対象動画の第2単位区間に写る作業者の作業種別を認識する。
【0010】
この開示によれば、学習済モデルは、単位区間におけるフレーム間差分画像を入力として受ける。一般に、作業者が作業を行っている単位区間におけるフレーム間差分画像は、作業者が不在である単位区間または作業者が作業を待機している単位区間におけるフレーム間差分画像と大きく異なる。そのため、作業認識装置は、認識対象動画の第2単位区間における第2フレーム間差分画像を学習済モデルに入力することにより、第2単位区間に写る作業者の作業種別を精度良く認識できる。さらに、学習済モデルは、特許文献1に開示の技術のように画像から抽出された骨格ノード情報の入力を必要としない。そのため、特許文献1に開示の技術のようにカメラの設置場所が制限されない。すなわち、学習用画像および認識対象画像を取得するためのカメラの設置場所の自由度が高い。
(【0011】以降は省略されています)
この特許をJ-PlatPat(特許庁公式サイト)で参照する
関連特許
オムロン株式会社
電磁継電器
4日前
オムロン株式会社
導線折り曲げ治具
8日前
オムロン株式会社
回転制御システム及び回転制御方法
8日前
オムロン株式会社
作業認識装置、作業認識方法およびプログラム
2日前
オムロン株式会社
情報処理システム、情報処理方法及びプログラム
2日前
オムロン株式会社
センサ、センサの制御方法、プログラム及び安全監視システム
7日前
個人
裁判のAI化
1か月前
個人
フラワーコートA
29日前
個人
工程設計支援装置
21日前
個人
情報処理システム
1か月前
個人
検査システム
1か月前
個人
介護情報提供システム
1か月前
個人
冷凍食品輸出支援構造
1日前
個人
為替ポイント伊達夢貯
1日前
個人
設計支援システム
1か月前
個人
携帯情報端末装置
22日前
個人
設計支援システム
1か月前
個人
知財出願支援AIシステム
1日前
キヤノン電子株式会社
携帯装置
1か月前
個人
不動産売買システム
2か月前
個人
結婚相手紹介支援システム
18日前
株式会社サタケ
籾摺・調製設備
1か月前
株式会社カクシン
支援装置
1か月前
個人
AIによる情報の売買の仲介
3日前
日本精機株式会社
施工管理システム
3日前
個人
備蓄品の管理方法
1か月前
個人
パスポートレス入出国システム
7日前
株式会社アジラ
進入判定装置
7日前
個人
アンケート支援システム
1か月前
個人
食事受注会計処理システム
8日前
キヤノン株式会社
情報処理装置
1か月前
サクサ株式会社
中継装置
1か月前
個人
冷凍加工連携型農場運用システム
1日前
大阪瓦斯株式会社
住宅設備機器
15日前
個人
ジェスチャーパッドのガイド部材
1か月前
サクサ株式会社
中継装置
1か月前
続きを見る
他の特許を見る