TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025091144
公報種別
公開特許公報(A)
公開日
2025-06-18
出願番号
2023206216
出願日
2023-12-06
発明の名称
グループ化畳み込み処理最適化装置およびグループ化畳み込み処理最適化方法
出願人
日本電気株式会社
代理人
個人
,
個人
主分類
G06N
3/0464 20230101AFI20250611BHJP(計算;計数)
要約
【課題】メモリアドレッシングに制約が課されたハードウェア回路がグループ化畳み込みを高速に実行できるグループ化畳み込み処理最適化装置を提供する。
【解決手段】グループ化畳み込みに対してM個のチャネルで構成されているデータごとに畳み込みの計算が実行される制約が課された場合、第i重み行列の右端に成分が零の列を(M-N/G)列分だけi=1~Gに渡ってそれぞれ挿入する列挿入処理と、第i重み行列の下端に成分が零の行を(M-N/G)行分だけi=1~Gに渡ってそれぞれ挿入する行挿入処理のうち少なくとも1つの処理を実行する第1挿入部21と、入力重み行列の第i×N/G列の右側に成分が零の列を(M-N/G)列分だけi=1~Gに渡ってそれぞれ挿入する入力重み行列挿入処理と、出力重み行列の第i×N/G行の下側に成分が零の行を(M-N/G)行分だけi=1~Gに渡ってそれぞれ挿入する出力重み行列挿入処理のうち少なくとも1つの処理を実行する第2挿入部22とを備える。
【選択図】図11
特許請求の範囲
【請求項1】
第1チャネル~第Nチャネル(Nは2以上の整数)が順に並べられて構成されているデータに対してN行N列の入力重み行列が使用されて畳み込みの計算が実行される入力畳み込みと、前記入力畳み込みによる結果がチャネル方向にG(Gは2以上の整数)個に分割され、分割された{(i-1)×N/G+1}チャネル~(i×N/G)チャネル(i=1~G)で構成されているデータに対してN/G行N/G列の第i重み行列が使用されて畳み込みの計算がi=1~Gに渡ってそれぞれ実行されるグループ化畳み込みと、前記グループ化畳み込みによる結果に対してN行N列の出力重み行列が使用されて畳み込みの計算が実行される出力畳み込みとがそれぞれ定義された学習済みの畳み込みニューラルネットワークに関して、前記グループ化畳み込みに対してM個のチャネル(MはN/Gよりも大きい整数)で構成されているデータごとに畳み込みの計算が実行される制約が課された場合、前記第i重み行列の右端に成分が零の列を(M-N/G)列分だけi=1~Gに渡ってそれぞれ挿入する列挿入処理と、前記第i重み行列の下端に成分が零の行を(M-N/G)行分だけi=1~Gに渡ってそれぞれ挿入する行挿入処理のうち少なくとも1つの処理を実行する第1挿入部と、
前記入力重み行列の第i×N/G列の右側に成分が零の列を(M-N/G)列分だけi=1~Gに渡ってそれぞれ挿入する入力重み行列挿入処理と、前記出力重み行列の第i×N/G行の下側に成分が零の行を(M-N/G)行分だけi=1~Gに渡ってそれぞれ挿入する出力重み行列挿入処理のうち少なくとも1つの処理を実行する第2挿入部とを備え、
前記第2挿入部は、
前記行挿入処理が実行された場合に前記入力重み行列挿入処理を実行し、
前記列挿入処理が実行された場合に前記出力重み行列挿入処理を実行する
ことを特徴とするグループ化畳み込み処理最適化装置。
続きを表示(約 2,200 文字)
【請求項2】
Mは、所定の数のN/Gよりも大きい倍数のうち最小の倍数である
請求項1記載のグループ化畳み込み処理最適化装置。
【請求項3】
グループ化畳み込みでは、左上から右下にかけて第i重み行列が対角線上にi=1~Gの順に配置された行列が重み行列として使用される
請求項1記載のグループ化畳み込み処理最適化装置。
【請求項4】
制約が課されたグループ化畳み込みの対象として入力されるデータのチャネル数である入力チャネル数と、前記グループ化畳み込みの結果として出力されるデータのチャネル数である出力チャネル数のうち少なくとも1つをM*Gに決定する決定部を備え、
第1挿入部は、
前記入力チャネル数がM*Gに決定された場合に行挿入処理を実行し、
前記出力チャネル数がM*Gに決定された場合に列挿入処理を実行する
請求項1記載のグループ化畳み込み処理最適化装置。
【請求項5】
学習済みの畳み込みニューラルネットワークに入力畳み込み、グループ化畳み込み、および出力畳み込みがそれぞれ定義されているか否かを判定する判定部を備える
請求項1から請求項4のうちのいずれか1項に記載のグループ化畳み込み処理最適化装置。
【請求項6】
第1チャネル~第Nチャネル(Nは2以上の整数)が順に並べられて構成されているデータに対してN行N列の入力重み行列が使用されて畳み込みの計算が実行される入力畳み込みと、前記入力畳み込みによる結果がチャネル方向にG(Gは2以上の整数)個に分割され、分割された{(i-1)×N/G+1}チャネル~(i×N/G)チャネル(i=1~G)で構成されているデータに対してN/G行N/G列の第i重み行列が使用されて畳み込みの計算がi=1~Gに渡ってそれぞれ実行されるグループ化畳み込みと、前記グループ化畳み込みによる結果に対してN行N列の出力重み行列が使用されて畳み込みの計算が実行される出力畳み込みとがそれぞれ定義された学習済みの畳み込みニューラルネットワークに関して、前記グループ化畳み込みに対してM個のチャネル(MはN/Gよりも大きい整数)で構成されているデータごとに畳み込みの計算が実行される制約が課された場合、前記第i重み行列の右端に成分が零の列を(M-N/G)列分だけi=1~Gに渡ってそれぞれ挿入する列挿入処理と、前記第i重み行列の下端に成分が零の行を(M-N/G)行分だけi=1~Gに渡ってそれぞれ挿入する行挿入処理のうち少なくとも1つの処理を実行し、
前記入力重み行列の第i×N/G列の右側に成分が零の列を(M-N/G)列分だけi=1~Gに渡ってそれぞれ挿入する入力重み行列挿入処理と、前記出力重み行列の第i×N/G行の下側に成分が零の行を(M-N/G)行分だけi=1~Gに渡ってそれぞれ挿入する出力重み行列挿入処理のうち少なくとも1つの処理を実行し、
前記行挿入処理が実行された場合に前記入力重み行列挿入処理を実行し、
前記列挿入処理が実行された場合に前記出力重み行列挿入処理を実行する
ことを特徴とするグループ化畳み込み処理最適化方法。
【請求項7】
コンピュータに、
第1チャネル~第Nチャネル(Nは2以上の整数)が順に並べられて構成されているデータに対してN行N列の入力重み行列が使用されて畳み込みの計算が実行される入力畳み込みと、前記入力畳み込みによる結果がチャネル方向にG(Gは2以上の整数)個に分割され、分割された{(i-1)×N/G+1}チャネル~(i×N/G)チャネル(i=1~G)で構成されているデータに対してN/G行N/G列の第i重み行列が使用されて畳み込みの計算がi=1~Gに渡ってそれぞれ実行されるグループ化畳み込みと、前記グループ化畳み込みによる結果に対してN行N列の出力重み行列が使用されて畳み込みの計算が実行される出力畳み込みとがそれぞれ定義された学習済みの畳み込みニューラルネットワークに関して、前記グループ化畳み込みに対してM個のチャネル(MはN/Gよりも大きい整数)で構成されているデータごとに畳み込みの計算が実行される制約が課された場合、前記第i重み行列の右端に成分が零の列を(M-N/G)列分だけi=1~Gに渡ってそれぞれ挿入する列挿入処理と、前記第i重み行列の下端に成分が零の行を(M-N/G)行分だけi=1~Gに渡ってそれぞれ挿入する行挿入処理のうち少なくとも1つの処理を実行する第1挿入処理、および
前記入力重み行列の第i×N/G列の右側に成分が零の列を(M-N/G)列分だけi=1~Gに渡ってそれぞれ挿入する入力重み行列挿入処理と、前記出力重み行列の第i×N/G行の下側に成分が零の行を(M-N/G)行分だけi=1~Gに渡ってそれぞれ挿入する出力重み行列挿入処理のうち少なくとも1つの処理を実行する第2挿入処理を実行させるためのグループ化畳み込み処理最適化プログラムであって、
前記第2挿入処理で、
前記行挿入処理が実行された場合に前記入力重み行列挿入処理を実行させ、
前記列挿入処理が実行された場合に前記出力重み行列挿入処理を実行させる
グループ化畳み込み処理最適化プログラム。
発明の詳細な説明
【技術分野】
【0001】
本開示は、グループ化畳み込み処理最適化装置、グループ化畳み込み処理最適化方法およびグループ化畳み込み処理最適化プログラムに関する。
続きを表示(約 1,200 文字)
【背景技術】
【0002】
畳み込みニューラルネットワーク(convolutional neural network;CNN)は、畳み込み層とプーリング層の2種類の層が交互に積み重ねられた構造を持つフィードフォーワード型のニューラルネットワークである。以下、畳み込みニューラルネットワークを単にCNNとも呼ぶ。
【0003】
図12は、畳み込みニューラルネットワークの例を示す説明図である。図12に示すCNNでは、第1畳み込み層、第1プーリング層、第2畳み込み層、第2プーリング層が交互に積み重ねられている。
【0004】
また、図12に示すC
1
、C
2
はそれぞれ、畳み込みの計算を表す。例えば、第1畳み込み層に入力される入力画像に対して、畳み込みの計算C
1
が実行される。
【0005】
なお、画像は、入力されるデータの一例である。CNNに入力されるデータは、画像以外のデータであってもよい。
【0006】
また、図12に示すP
1
、P
2
はそれぞれ、プーリングの計算を表す。例えば、第1プーリング層に入力される畳み込みの計算結果に対して、プーリングの計算P
1
が実行される。
【0007】
また、図12に示すFは、全結合ネットワークを表す。全結合ネットワークFは、第2プーリング層のノードと出力層のノードを全て結合する全結合層の機能を有する。最終的に、出力層からCNNの出力が得られる。
【0008】
以下、CNNにおける畳み込みの計算を具体的に説明する。図13は、CNNにおける畳み込みの計算の例を示す説明図である。なお、図13に示す畳み込みの計算の例は、図12に示す畳み込みの計算C
1
に相当する。
【0009】
図13に示す入力画像は、CNNに入力される画像である。図13に示す入力画像は、第1チャネル~第C
in
チャネル(C
in
は2以上の整数)が順に並べられて構成されている。すなわち、C
in
は、入力チャネル数を意味する。また、図13に示すように、入力画像を構成する画像の縦のサイズはH、横のサイズはWである。
【0010】
説明を簡便にするため、畳み込みの計算の対象である入力Xとして、図13に示す格子模様が記された縦のサイズが1、横のサイズが1、チャネル数がC
in
の画像を考える。図13の下段には、高さ方向から見た場合の入力Xが記載されている。また、図13に示す入力Xの下の符号は、チャネルの識別番号である(他の図においても同様)。
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
日本電気株式会社
推論装置および推論方法
11日前
日本電気株式会社
光軸調整方法および装置
3日前
日本電気株式会社
ボロメータ及びボロメータアレイ
25日前
日本電気株式会社
素材変換装置および素材変換方法
11日前
日本電気株式会社
サーバ、制御方法、及びプログラム
22日前
日本電気株式会社
制御装置、制御方法、及びプログラム
4日前
日本電気株式会社
画像処理装置、方法、及びプログラム
1か月前
日本電気株式会社
端末、端末の制御方法及びプログラム
16日前
日本電気株式会社
膜製造方法、積層構造、及びボロメータ
11日前
日本電気株式会社
評価装置、評価方法、およびプログラム
12日前
日本電気株式会社
画像処理装置、画像処理方法、プログラム
23日前
日本電気株式会社
判定システム、判定方法、及びプログラム
9日前
日本電気株式会社
共振器、発振器、および共振器の製造方法
5日前
日本電気株式会社
デジタル署名システム、方法並びに記録媒体
2日前
日本電気株式会社
配信装置、配信方法、及び、配信プログラム
5日前
日本電気株式会社
注文システム、注文受付方法及びプログラム
19日前
日本電気株式会社
プログラム、情報処理方法、及び情報処理装置
5日前
日本電気株式会社
プログラム、情報処理方法、及び情報処理装置
5日前
日本電気株式会社
モデル生成装置、モデル生成方法、プログラム
4日前
日本電気株式会社
在庫管理装置、在庫管理方法、及びプログラム
25日前
日本電気株式会社
情報処理システム、位置標定方法、プログラム
23日前
日本電気株式会社
情報処理装置、情報処理方法、およびプログラム
12日前
日本電気株式会社
デルタシグマ変調装置及びデルタシグマ変調方法
15日前
日本電気株式会社
商品推奨装置、商品推奨方法、およびプログラム
19日前
日本電気株式会社
デルタシグマ変調装置及びデルタシグマ変調方法
29日前
日本電気株式会社
端末、システム、端末の制御方法及びプログラム
10日前
日本電気株式会社
端末、システム、端末の制御方法及びプログラム
10日前
日本電気株式会社
情報処理装置、情報処理方法、およびプログラム
4日前
日本電気株式会社
サーバ装置、サーバ装置の制御方法及びプログラム
11日前
日本電気株式会社
関係可視化装置、関係可視化方法、及びプログラム
4日前
日本電気株式会社
サーバ装置、サーバ装置の制御方法及びプログラム
15日前
日本電気株式会社
ポリシー管理装置、ポリシー管理方法及びプログラム
5日前
日本電気株式会社
光トランシーバ、光通信システム及び光信号の受信方法
10日前
日本電気株式会社
監視システム、監視装置、監視方法、及び、プログラム
22日前
日本電気株式会社
位置情報可視化システム、装置、方法およびプログラム
5日前
日本電気株式会社
情報処理装置、表示制御方法、および表示制御プログラム
12日前
続きを見る
他の特許を見る