TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025137128
公報種別公開特許公報(A)
公開日2025-09-19
出願番号2024036149
出願日2024-03-08
発明の名称情報処理装置、情報処理方法、及びプログラム
出願人日本電気株式会社
代理人個人
主分類G06T 15/00 20110101AFI20250911BHJP(計算;計数)
要約【課題】空間の表現能力が向上した3次元形状補完手法を実現する情報処理装置、方法及びプログラムを提供する。
【解決手段】情報処理装置は、学習フェーズ用の入力データを取得する取得部と、入力データに含まれる各ピクセルの3次元座標を、デプスデータにおける各ピクセルのデプスデータを参照することによって特定して3次元構造データを生成する3次元構造データ生成部と、3次元構造データをサンプリングすることによって、サンプリング後の3次元構造データを生成するサンプリング部と、サンプリング後の3次元構造データに対して、遮蔽個所や欠損個所を推定して補完処理を適用する補完部と、補完処理における中間特徴量を参照した形状推定処理を実行する推定部と、形状推定処理によって得られた形状に関する損失値である第1の損失値を参照して、補完手段を学習させる第1の学習部とを備える。
【選択図】図1
特許請求の範囲【請求項1】
入力データを取得する取得手段と、
前記入力データから3次元構造データを生成する3次元構造データ生成手段と、
前記3次元構造データをサンプリングすることによって、サンプリング後の3次元構造データを生成するサンプリング手段と、
前記サンプリング後の3次元構造データに対して補完処理を適用する補完手段と、
前記補完処理における中間特徴量を参照した形状推定処理を実行する推定手段と、
前記形状推定処理によって得られた形状に関する損失値である第1の損失値を参照して、前記補完手段を学習させる第1の学習手段と
を備えている情報処理装置。
続きを表示(約 1,900 文字)【請求項2】
前記推定手段は、前記形状推定処理において1又は複数の距離関数値を算出し、
前記第1の損失値は、前記1又は複数の距離関数値に関する損失値である
請求項1に記載の情報処理装置。
【請求項3】
前記推定手段は、
前記補完処理における前記中間特徴量を潜在変数に変換する特徴量変換手段と、
前記潜在変数と、前記前記サンプリング後の3次元構造データとを参照して前記形状推定処理を実行する形状推定手段と
を備えている
請求項2に記載の情報処理装置。
【請求項4】
前記補完手段は、
前記サンプリング後の3次元構造データが入力され、前記中間特徴量を出力するエンコーダと、
前記中間特徴量が入力され、補完後の3次元構造データを出力するデコーダと
を備え、
前記第1の学習手段は、
前記第1の損失値を参照して、前記エンコーダを機械学習させる
請求項1から3の何れか1項に記載の情報処理装置。
【請求項5】
前記デコーダが出力した前記補完後の3次元構造データと、前記3次元構造データ生成手段が生成した3次元構造データとの相違を示す第2の損失値を参照して、前記エンコーダと前記デコーダとを機械学習させる第2の学習手段と
を備えている請求項4に記載の情報処理装置。
【請求項6】
入力データを取得する取得手段と、
前記入力データから3次元構造データを生成する3次元構造データ生成手段と、
前記3次元構造データに対して補完処理を適用する補完手段と、
前記補完処理が適用された3次元構造データから出力データを生成する出力データ生成手段と
を備え、
前記補完手段は、
学習用データから生成された3次元構造データをサンプリングすることによって、サンプリング後の3次元構造データを生成するサンプリング処理と、
前記サンプリング後の3次元構造データに対する当該補完手段による補完処理と、
前記補完処理における中間特徴量を参照した形状推定処理と、
前記形状推定処理によって得られた形状に関する損失値である第1の損失値を参照して、前記補完手段を学習させる第1の学習処理と
によって学習されたものである
情報処理装置。
【請求項7】
入力データを取得することと、
前記入力データから3次元構造データを生成することと、
前記3次元構造データをサンプリングすることによって、サンプリング後の3次元構造データを生成することと、
前記サンプリング後の3次元構造データに対して補完手段による補完処理を適用することと、
前記補完処理における中間特徴量を参照した形状推定処理を実行することと、
前記形状推定処理によって得られた形状に関する損失値である第1の損失値を参照して、前記補完手段を学習させることと
を含んでいる情報処理方法。
【請求項8】
入力データを取得することと、
前記入力データから3次元構造データを生成することと、
前記3次元構造データに対して補完手段による補完処理を適用することと、
前記補完処理が適用された3次元構造データから出力データを生成することと
を含み、
前記補完手段は、
学習用データから生成された3次元構造データをサンプリングすることによって、サンプリング後の3次元構造データを生成することと、
前記サンプリング後の3次元構造データに対する当該補完手段による補完処理を適用することと、
前記補完処理における中間特徴量を参照した形状推定処理を実行することと、
前記形状推定処理によって得られた形状に関する損失値である第1の損失値を参照して、前記補完手段を学習させることと
によって学習されたものである
情報処理方法。
【請求項9】
請求項1に記載の情報処理装置としてコンピュータを機能させるためのプログラムであって、前記取得手段、前記3次元構造データ生成手段、前記サンプリング手段、前記補完手段、前記推定手段、及び前記第1の学習手段としてコンピュータを機能させるためのプログラム。
【請求項10】
請求項6に記載の情報処理装置としてコンピュータを機能させるためのプログラムであって、前記取得手段、前記3次元構造データ生成手段、前記補完手段、及び前記出力データ生成手段としてコンピュータを機能させるためのプログラム。

発明の詳細な説明【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法、及びプログラムに関する。
続きを表示(約 1,900 文字)【背景技術】
【0002】
実世界をセンサによってスキャンし再構成する技術が知られている。また、当該再構成によって得られた3次元データには、遮蔽領域や欠損領域が発生し得ることから、これらの領域を補完する方法も知られている(例えば非特許文献1)。
【先行技術文献】
【非特許文献】
【0003】
Angela Dai et. al.,SG-NN: Sparse Generative Neural Networks for Self-Supervised Scene Completion of RGB-D Scans,2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR).
【発明の概要】
【発明が解決しようとする課題】
【0004】
非特許文献1に記載の技術は、Voxelベースの3次元形状補完手法であるが、空間の表現能力が限定的であるという問題があった。
【0005】
本開示は、上記の問題に鑑みてなされたものであり、その一例示的目的は、空間の表現能力が向上した3次元形状補完手法を提供することにある。
【課題を解決するための手段】
【0006】
本開示の一例示的側面に係る情報処理装置は、入力データを取得する取得手段と、前記入力データから3次元構造データを生成する3次元構造データ生成手段と、前記3次元構造データをサンプリングすることによって、サンプリング後の3次元構造データを生成するサンプリング手段と、前記サンプリング後の3次元構造データに対して補完処理を適用する補完手段と、前記補完処理における中間特徴量を参照した形状推定処理を実行する推定手段と、前記形状推定処理によって得られた形状に関する損失値である第1の損失値を参照して、前記補完手段を学習させる第1の学習手段とを備えている。
【0007】
本開示の一例示的側面に係る情報処理装置は、入力データを取得する取得手段と、前記入力データから3次元構造データを生成する3次元構造データ生成手段と、前記3次元構造データに対して補完処理を適用する補完手段と、前記補完処理が適用された3次元構造データから出力データを生成する出力データ生成手段とを備え、前記補完手段は、学習用データから生成された3次元構造データをサンプリングすることによって、サンプリング後の3次元構造データを生成するサンプリング処理と、前記サンプリング後の3次元構造データに対する当該補完手段による補完処理と、前記補完処理における中間特徴量を参照した形状推定処理と、前記形状推定処理によって得られた形状に関する損失値である第1の損失値を参照して、前記補完手段を学習させる第1の学習処理とによって学習されたものである。
【0008】
本開示の一例示的側面に係る情報処理方法は、入力データを取得することと、前記入力データから3次元構造データを生成することと、前記3次元構造データをサンプリングすることによって、サンプリング後の3次元構造データを生成することと、前記サンプリング後の3次元構造データに対して補完手段による補完処理を適用することと、前記補完処理における中間特徴量を参照した形状推定処理を実行することと、前記形状推定処理によって得られた形状に関する損失値である第1の損失値を参照して、前記補完手段を学習させることとを含んでいる。
【0009】
本開示の一例示的側面に係る情報処理方法は、入力データを取得することと、前記入力データから3次元構造データを生成することと、前記3次元構造データに対して補完手段による補完処理を適用することと、前記補完処理が適用された3次元構造データから出力データを生成することとを含み、前記補完手段は、学習用データから生成された3次元構造データをサンプリングすることによって、サンプリング後の3次元構造データを生成することと、前記サンプリング後の3次元構造データに対する当該補完手段による補完処理を適用することと、前記補完処理における中間特徴量を参照した形状推定処理を実行することと、前記形状推定処理によって得られた形状に関する損失値である第1の損失値を参照して、前記補完手段を学習させることとによって学習されたものである。
【発明の効果】
【0010】
本開示の一例示的側面によれば、空間の表現能力が向上した3次元形状補完手法を提供することができるという一例示的効果を奏する。
【図面の簡単な説明】
(【0011】以降は省略されています)

この特許をJ-PlatPat(特許庁公式サイト)で参照する

関連特許

日本電気株式会社
分析装置
今日
日本電気株式会社
量子回路装置と制御方法
今日
日本電気株式会社
量子回路装置と制御方法
今日
日本電気株式会社
検知装置および検知方法
今日
日本電気株式会社
システム及びマイグレーション方法
今日
日本電気株式会社
推定装置、推定方法及びプログラム
3日前
日本電気株式会社
推定装置、推定方法及びプログラム
3日前
日本電気株式会社
処理装置、処理方法、及びプログラム
今日
日本電気株式会社
予測システム、予測方法及びプログラム
3日前
日本電気株式会社
映像伝送装置、映像伝送方法、プログラム
今日
日本電気株式会社
映像処理装置、映像処理方法、プログラム
今日
日本電気株式会社
情報処理システム、処理方法、プログラム
今日
日本電気株式会社
処理システム、処理方法およびプログラム
3日前
日本電気株式会社
情報処理装置、情報処理方法及びプログラム
3日前
日本電気株式会社
処理システム、処理方法、およびプログラム
今日
日本電気株式会社
処理システム、処理方法、およびプログラム
今日
日本電気株式会社
情報処理装置、情報処理方法、及びプログラム
今日
日本電気株式会社
ファン、制御方法、通知方法およびプログラム
今日
日本電気株式会社
情報処理装置、情報処理方法およびプログラム
10日前
日本電気株式会社
情報処理装置、情報処理方法、及びプログラム
今日
日本電気株式会社
情報処理装置、情報処理方法、及びプログラム
10日前
日本電気株式会社
情報処理装置、情報処理方法、及びプログラム
今日
日本電気株式会社
認証システム、認証装置、方法及びプログラム
今日
日本電気株式会社
端末、システム、端末の制御方法及びプログラム
3日前
日本電気株式会社
端末、システム、端末の制御方法及びプログラム
4日前
日本電気株式会社
商品管理装置、商品管理方法、及び、プログラム
今日
日本電気株式会社
ベクトル化装置、ベクトル化方法及びプログラム
3日前
日本電気株式会社
生産計画システム、生産計画方法及びプログラム
今日
日本電気株式会社
変更管理装置、変更管理方法、およびプログラム
今日
日本電気株式会社
画像生成装置、画像切り出し方法及びプログラム
今日
日本電気株式会社
サーバ装置、サーバ装置の制御方法及びプログラム
3日前
日本電気株式会社
秘密鍵復元装置、秘密鍵復元方法およびプログラム
今日
日本電気株式会社
サーバ装置、サーバ装置の制御方法及びプログラム
今日
日本電気株式会社
認証システム、認証方法、認証装置、及びプログラム
今日
日本電気株式会社
認証装置、認証システム、認証方法およびプログラム
今日
日本電気株式会社
選定装置、推定システム、選定方法、及びプログラム
3日前
続きを見る