TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025096780
公報種別公開特許公報(A)
公開日2025-06-30
出願番号2023212685
出願日2023-12-18
発明の名称学習モデル評価装置、方法及びプログラム、並びに、学習装置
出願人株式会社デンソーテン
代理人弁理士法人 佐野特許事務所
主分類G06N 3/0464 20230101AFI20250623BHJP(計算;計数)
要約【課題】学習モデルの良し悪しを適正に評価する。
【解決手段】学習モデル評価装置は、畳み込み層を有するニューラルネットワークにより構成された学習モデルを評価する。学習モデル評価装置は、学習用データを用いて学習モデルを学習させる評価用学習を行い、評価用学習後の学習モデルの畳み込み層における複数の重みパラメータの各値に基づき評価指標を導出する。
【選択図】図9
特許請求の範囲【請求項1】
畳み込み層を有するニューラルネットワークにより構成された学習モデルを評価する学習モデル評価装置であって、
学習用データを用いて前記学習モデルを学習させる評価用学習を行い、前記評価用学習後の前記学習モデルの前記畳み込み層における複数の重みパラメータの各値に基づき評価指標を導出する
、学習モデル評価装置。
続きを表示(約 1,500 文字)【請求項2】
前記評価用学習後の前記学習モデルおける前記複数の重みパラメータに対して特異値分解を行い、当該特異値分解により得られる複数の特異値の平均値に基づき、前記評価指標を導出する
、請求項1に記載の学習モデル評価装置。
【請求項3】
前記評価用学習後の前記学習モデルにおける前記複数の重みパラメータに対して特異値分解を行い、当該特異値分解により得られる複数の特異値の内、閾値を超える特異値の総数が、前記複数の特異値の全数を占める割合を導出し、前記割合に基づき前記評価指標を導出する
、請求項1に記載の学習モデル評価装置。
【請求項4】
前記評価用学習後の前記学習モデルにおける前記複数の重みパラメータの内、閾値を超える重みパラメータの総数が、前記複数の重みパラメータの全数を占める割合を導出し、前記割合に基づき前記評価指標を導出する
、請求項1に記載の学習モデル評価装置。
【請求項5】
畳み込み層と前記畳み込み層の後段に配置されたバッチ正規化層を有するニューラルネットワークにより構成された学習モデルを評価する学習モデル評価装置であって、
学習用データを用いて前記学習モデルを学習させる評価用学習を行い、前記評価用学習後の前記学習モデルの前記バッチ正規化層における複数のスケールパラメータの各値に基づき評価指標を導出する
、学習モデル評価装置。
【請求項6】
前記評価用学習後の前記学習モデルおける前記複数のスケールパラメータの平均値に基づき、前記評価指標を導出する
、請求項5に記載の学習モデル評価装置。
【請求項7】
請求項1~6の何れかに記載の学習モデル評価装置を有する学習装置であって、
前記学習モデル評価装置を用いて複数の学習モデルに対する複数の評価指標を導出し、
前記複数の評価指標に基づき前記複数の学習モデルの中から対象モデルを選択し、前記学習用データを用いて前記評価用学習よりも多い学習回数にて前記対象モデルを学習させる
、学習装置。
【請求項8】
畳み込み層を有するニューラルネットワークにより構成された学習モデルを評価する学習モデル評価方法であって、
学習用データを用いて前記学習モデルを学習させる評価用学習を行い、前記評価用学習後の前記学習モデルの前記畳み込み層における複数の重みパラメータの各値に基づき評価指標を導出する
、学習モデル評価方法。
【請求項9】
畳み込み層と前記畳み込み層の後段に配置されたバッチ正規化層を有するニューラルネットワークにより構成された学習モデルを評価する学習モデル評価方法であって、
学習用データを用いて前記学習モデルを学習させる評価用学習を行い、前記評価用学習後の前記学習モデルの前記バッチ正規化層における複数のスケールパラメータの各値に基づき評価指標を導出する
、学習モデル評価方法。
【請求項10】
畳み込み層を有するニューラルネットワークにより構成された学習モデルを評価する学習モデル評価方法を、コンピュータに実行させるプログラムであって、
前記学習モデル評価方法では、学習用データを用いて前記学習モデルを学習させる評価用学習を行い、前記評価用学習後の前記学習モデルの前記畳み込み層における複数の重みパラメータの各値に基づき評価指標を導出する
、学習モデル評価プログラム。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本発明は、学習モデル評価装置、方法及びプログラム、並びに、学習装置に関する。
続きを表示(約 2,000 文字)【背景技術】
【0002】
DNN(ディープニューラルネットワーク)を有するモデルを用いた様々な演算処理が実用化されている。DNNの設計では、設計者がDNNの層(畳み込み層、プーリング層など)ごとに設計パラメータ(カーネルサイズ、出力チャネル数など)を決定する必要がある。近年、DNNは多層化が進んでおり、100層を超えるDNNも多く存在する。DNNの設計工程では、DNNの構造設定とDNNの性能評価とを含むプロセスを複数回繰り返すことで、DNNの設計の最適化を図る。但し、多層のDNNにおける設計パラメータの候補数は膨大であり、設計者自身のみでDNNの設計を最適化させることは難しい。
【0003】
DNNの設計を自動化する方法としてNAS(Neural Architecture Search)と呼ばれる手法が提案されている。NASでは、事前にDNNの設計パターンの候補 (探索空間) を定めておく。そして、探索空間からモデルをサンプリングした後、比較的短い時間でのモデルの学習(数イテレーションから数エポック程度の学習)を経てモデルの評価を行うという一連の処理を、所望の目標性能が得られるまで繰り返す。この際、少ない探索回数で目標性能を得るための効率的なサンプリング手法として、TPEを用いたベイズ最適化、NSGAよる進化アルゴリズム、強化学習などが良く用いられる。TPEは“Tree-Structured Parzen Estimator”の略称である。NSGAは“Non-dominated Sorting Genetic Algorithm”の略称である。尚、下記特許文献1には、目標ハードウェアの目標制約条件に応じた探索空間情報を選定する方法が開示さている。
【0004】
通常のNASは、多少なりともモデルを学習する必要がある。このためDNN又はデータセットが大規模である場合には、目標性能が得られるまでの探索に相応の時間を要する。これに鑑み、DNNの設計にあたって学習が不要となる又は少ない学習回数でDNNの設計を完了させるNASとして、Zero-Shot NASが提案されている。Zero-Shot NASによれば探索時間を大幅に削減できる。
【先行技術文献】
【特許文献】
【0005】
特開第7111671号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
Zero-Shot NASではDNNの構造の良し悪しを判別するための評価指標が必要となる。既存の評価指標はDNNのパラメータ数と高い相関がある。そして、既存の評価指標を用いた評価方法(既存のZero-Shot NASによる評価方法)では、パラメータ数が多いほど良いDNNであると判定する傾向がある。このような判定が正しい場合もあるが、実際には、データセット、学習タスク又は探索空間等に依存して当該判定が適正とならない場合も多い。また、パラメータ数が多いほど複雑な演算が可能とはなるが、不必要にパラメータ数が多いと無駄な演算が多くなる。過大なパラメータ数は過学習に繋がることもある。
【0007】
そこで、DNNのパラメータ数に依存しない適正な評価指標が求められる。適正な評価指標を用いてDNNの構造の良し悪し(換言すればモデルの構造の良し悪し)を評価できれば、モデル間の優劣を正しく評価できる。より優れたモデルに対して学習を行うことで、良好な学習済みモデルを得ることが可能となる。
【0008】
本発明は、学習モデルの適正な評価に資する学習モデル評価装置、方法及びプログラムを提供することを目的とする。また本発明は、良好な学習済みモデルの生成に寄与する学習装置を提供することを目的とする。
【課題を解決するための手段】
【0009】
本発明に係る学習モデル評価装置は、畳み込み層を有するニューラルネットワークにより構成された学習モデルを評価する学習モデル評価装置であって、学習用データを用いて前記学習モデルを学習させる評価用学習を行い、前記評価用学習後の前記学習モデルの前記畳み込み層における複数の重みパラメータの各値に基づき評価指標を導出する。
【発明の効果】
【0010】
重みパラメータの各値に基づく評価指標を用いることにより、学習モデルの構造の良し悪しを適正に評価することが可能である。学習モデルの構造の良し悪しを適正に評価できれば、複数の学習モデルを適正に序列化できる(真に優れたモデルに対して高い序列を与えることができる)。そして例えば、最も高い序列が割り当てられた学習モデルに対し、評価用学習よりも学習回数を高めた学習を行うことで、高精度の学習済みモデルを得ることができる。
【図面の簡単な説明】
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

個人
対話装置
24日前
個人
情報処理装置
24日前
個人
記入設定プラグイン
12日前
個人
情報処理装置
20日前
個人
情報入力装置
24日前
個人
不動産売買システム
4日前
個人
物価スライド機能付生命保険
24日前
個人
マイホーム非電子入札システム
24日前
株式会社BONNOU
管理装置
17日前
個人
決済手数料0%のクレジットカード
27日前
株式会社東芝
電子機器
5日前
サクサ株式会社
カードの制動構造
26日前
株式会社ワコム
電子消去具
4日前
ホシデン株式会社
タッチ入力装置
4日前
個人
パターン抽出方法及び通信多重化方法
3日前
株式会社ライト
情報処理装置
17日前
トヨタ自動車株式会社
情報処理装置
1か月前
村田機械株式会社
割当補助システム
1か月前
住友重機械工業株式会社
力覚伝達装置
19日前
株式会社CBE-A
情報処理システム
3日前
大王製紙株式会社
RFIDタグ
3日前
株式会社半導体エネルギー研究所
会計システム
10日前
株式会社WellGo
個人情報利用方法
20日前
株式会社豆蔵
ピッキング装置
26日前
株式会社半導体エネルギー研究所
検索支援方法
17日前
株式会社mov
情報処理システム
24日前
シャープ株式会社
通信装置
24日前
個人
システム、データおよびプログラム
13日前
株式会社WellGo
個人情報秘匿方法
20日前
トヨタ自動車株式会社
リスク評価システム
1か月前
個人
輸送管理装置及び輸送管理方法
24日前
トヨタ自動車株式会社
データ収集システム
18日前
株式会社WellGo
ストレージサービス
20日前
ユニティガードシステム株式会社
警備支援システム
1か月前
キヤノン株式会社
印刷システム
3日前
株式会社Rist
情報処理方法
25日前
続きを見る