TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025110024
公報種別公開特許公報(A)
公開日2025-07-28
出願番号2024003704
出願日2024-01-15
発明の名称映像符号化装置、映像復号装置、映像符号化方法、および映像復号方法
出願人日本電気株式会社
代理人個人,個人
主分類H04N 19/463 20140101AFI20250718BHJP(電気通信技術)
要約【課題】確率分布の推定ができなくなる状況を回避する。
【解決手段】映像符号化装置50は、符号化対象テンソルから複数の縮小領域のテンソルを生成する縮小手段51と、複数の縮小領域のテンソルを入力して、各々の確率分布を推定する複数の確率分布推定手段52と、符号化対象テンソルと複数の縮小領域のテンソルとを、確率分布を使用してエントロピー符号化して、ビットストリームを生成するエントロピー符号化手段53と、ビットストリームを多重化する多重化手段54とを備え、エントロピー符号化手段53は、符号化対象テンソルまたは縮小領域よりも小さいサイズの縮小領域のテンソルから推定される確率分布を使用し、符号化対象テンソルのサイズが所定サイズよりも小さい場合に、複数の確率分布推定手段52の各々に縮小領域のテンソルの要素が一つ以上入力されるように、縮小手段51の縮小処理を制御する縮小制御手段55を備える。
【選択図】図16
特許請求の範囲【請求項1】
符号化対象テンソルから複数の縮小領域のテンソルを生成する縮小手段と、
前記複数の縮小領域のテンソルを入力して、各々の確率分布を推定する複数の確率分布推定手段と、
前記符号化対象テンソルと前記複数の縮小領域のテンソルとを、前記確率分布を使用してエントロピー符号化して、ビットストリームを生成するエントロピー符号化手段と、
前記ビットストリームを多重化する多重化手段とを備え、
前記エントロピー符号化手段は、前記符号化対象テンソルまたは前記縮小領域よりも小さいサイズの縮小領域のテンソルから推定される確率分布を使用し、
前記符号化対象テンソルのサイズが所定サイズよりも小さい場合に、前記複数の確率分布推定手段の各々に前記縮小領域のテンソルの要素が一つ以上入力されるように、前記縮小手段の縮小処理を制御する縮小制御手段を備える
映像符号化装置。
続きを表示(約 2,300 文字)【請求項2】
前記縮小制御手段は、前記符号化対象テンソルのサイズに応じて、前記縮小領域の数を決定する
請求項1に記載の映像符号化装置。
【請求項3】
前記エントロピー符号化手段は、符号化対象の前記符号化対象テンソルまた前記縮小領域のサイズに最も近いサイズの縮小領域のテンソルから推定される確率分布を使用する
請求項1または請求項2に記載の映像符号化装置。
【請求項4】
前記エントロピー符号化手段は、最小の縮小領域のテンソルを、あらかじめ決められた固定確率分布を使用してエントロピー符号化する
請求項3に記載の映像符号化装置。
【請求項5】
符号化対象テンソルと該符号化対象テンソルから生成された複数の縮小領域のテンソルとが、確率分布を使用してエントロピー符号化されて生成されたビットストリームが多重化された多重化ビットストリームの多重化を解除する多重化解除手段と、
前記符号化対象テンソルと前記複数の縮小領域のテンソルとを対象として、確率分布を使用してエントロピー復号を行うエントロピー復号手段と、
前記エントロピー復号によって得られる複数のテンソルを合成する合成手段とを備え、
映像符号化時には、前記エントロピー符号化で使用される確率分布を推定する手段の各々に前記縮小領域のテンソルの要素が一つ以上入力されることが保証されており、
前記エントロピー復号手段は、復号対象の前記符号化対象テンソルまたは前記縮小領域よりも小さいサイズの縮小領域のテンソルから推定される確率分布を使用する
映像復号装置。
【請求項6】
前記符号化対象テンソルのサイズに基づいて前記縮小領域の数を推定する縮小領域数推定手段を備える
請求項5に記載の映像復号装置。
【請求項7】
符号化対象テンソルから複数の縮小領域のテンソルを生成する縮小処理を実行し、
前記複数の縮小領域のテンソルを入力して、各々の確率分布を推定し、
前記符号化対象テンソルと前記複数の縮小領域のテンソルとを、前記確率分布を使用してエントロピー符号化して、ビットストリームを生成し、
前記ビットストリームを多重化し、
前記エントロピー符号化するときに、前記符号化対象テンソルまたは前記縮小領域よりも小さいサイズの縮小領域のテンソルから推定される確率分布を使用し、
前記符号化対象テンソルのサイズが所定サイズよりも小さい場合に、前記複数の確率分布を推定するときに、前記縮小領域のテンソルの要素が一つ以上使用可能であるように、前記縮小処理を制御する
映像符号化方法。
【請求項8】
符号化対象テンソルと該符号化対象テンソルから生成された複数の縮小領域のテンソルとが、確率分布を使用してエントロピー符号化されて生成されたビットストリームが多重化された多重化ビットストリームの多重化を解除し、
前記符号化対象テンソルと前記複数の縮小領域のテンソルとを対象として、確率分布を使用してエントロピー復号を行い、
前記エントロピー復号によって得られる複数のテンソルを合成し、
映像符号化時には、前記エントロピー符号化で使用される確率分布を推定する手段の各々に前記縮小領域のテンソルの要素が一つ以上入力されることが保証されており、
前記エントロピー復号を行うときに、復号対象の前記符号化対象テンソルまたは前記縮小領域よりも小さいサイズの縮小領域のテンソルから推定される確率分布を使用する
映像復号方法。
【請求項9】
コンピュータに、
符号化対象テンソルから複数の縮小領域のテンソルを生成する縮小処理と、
前記複数の縮小領域のテンソルを入力して、各々の確率分布を推定する処理と、
前記符号化対象テンソルと前記複数の縮小領域のテンソルとを、前記確率分布を使用してエントロピー符号化して、ビットストリームを生成する処理と、
前記ビットストリームを多重化する処理とを実行させ、
前記エントロピー符号化するときに、前記符号化対象テンソルまたは前記縮小領域よりも小さいサイズの縮小領域のテンソルから推定される確率分布を使用させ、
前記符号化対象テンソルのサイズが所定サイズよりも小さい場合に、前記複数の確率分布を推定するときに、前記縮小領域のテンソルの要素が一つ以上使用可能であるように、前記縮小処理を制御させる
ための映像符号化プログラム。
【請求項10】
コンピュータに、
符号化対象テンソルと該符号化対象テンソルから生成された複数の縮小領域のテンソルとが、確率分布を使用してエントロピー符号化されて生成されたビットストリームが多重化された多重化ビットストリームの多重化を解除する処理と、
前記符号化対象テンソルと前記複数の縮小領域のテンソルとを対象として、確率分布を使用してエントロピー復号を行う処理と、
前記エントロピー復号によって得られる複数のテンソルを合成する処理とを実行させ、
映像符号化時には、前記エントロピー符号化で使用される確率分布を推定する手段の各々に前記縮小領域のテンソルの要素が一つ以上入力されることが保証されており、
前記コンピュータに、前記エントロピー復号を行うときに、復号対象の前記符号化対象テンソルまたは前記縮小領域よりも小さいサイズの縮小領域のテンソルから推定される確率分布を使用させる
ための映像復号プログラム。

発明の詳細な説明【技術分野】
【0001】
本開示は、ニューラルネットワークを利用する映像符号化装置、映像復号装置、映像符号化方法、および映像復号方法に関する。
続きを表示(約 1,600 文字)【背景技術】
【0002】
ニューラルネットワークの一つである自己符号化器(Auto-encoder)、量子化、および、エントロピー符号化を組合せた新たな映像符号化技術が、非特許文献1に記載されている。
【0003】
自己符号化器は、入力データを、重要な特徴だけを含むように、低次元の特徴テンソルに圧縮する。その後、自己符号化器は、低次元の特徴テンソルを元の次元に再構築した再構築データを生成する。低次元の特徴テンソルに落とし込む処理(前半部分)をエンコードと呼ぶ。再構築データを生成する処理(後半部分)をデコードと呼ぶ。
【0004】
自己符号化器の学習は、再構築誤差(入力データと再構築データとの差)を最小化するように進められる。有意義な特徴量が得られるように、自己符号化器は、エンコードの構造に制約を加えたり、ネットワークの損失関数に正則化項を追加するように設計される。
【0005】
非特許文献2には、所定のテンソルを入力し、確率モデル(すなわち、予測の確率分布)を使用して入力テンソルをエントロピー符号化する手法が記載されている。この手法では、まず、入力テンソルをダウンサンプリングすることにより、入力テンソルのスケールよりも小さいスケールのテンソルを獲得する。獲得したテンソルから確率分布を推定し、そのテンソルをエントロピー符号化する。その後、その推定した確率分布を用いて入力テンソルをエントロピー符号化する。そのような手法を、MSPSM(Multi-Scale Progressive Statistical Model)エントロピー符号化と呼ぶ。MSPSMエントロピー符号化を、単に、MSPSMと表記する。
【0006】
以下、所定のテンソルとして、自己符号化器におけるエンコーダが出力するテンソルに量子化を適用することにより得られる特徴テンソルを例にする。
【先行技術文献】
【非特許文献】
【0007】
J. Ball’e, V. Laparra, and E. P. Simoncelli, "End-to-end Optimized Image Compression", published as a conference paper at ICLR 2017
N. Le et al., "Learned Image Coding for Machines: A Content-Adaptive Approach", IEEE International Conference on Multimedia and Expo (ICME), 2021
【発明の概要】
【発明が解決しようとする課題】
【0008】
図1は、MSPSMの実現例を示すブロック図である。図1に示す構成を、MSPSMシステムとする。
【0009】
MSPSMシステムは、エンコーダからの入力特徴テンソルをダウンサンプリングする。MSPSMシステムは、ダウンサンプリングで得られる特徴テンソルを、さらにダウンサンプリングする。MSPSMシステムは、ダウンサンプリングで得られる特徴テンソルのダウンサンプリングを繰り返す。i回目のダウンサンプリングで得られる特徴テンソルを、スケールiの特徴テンソルという。iを、スケール数という。
【0010】
スケールiの特徴テンソルを、y

と表現することがある。スケールiの特徴テンソルから推定された確率分布をp

と表現し、p

を推定した際のコンテキスト情報をz

と表現する。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

個人
携帯端末保持具
2か月前
個人
音響装置
2か月前
個人
店内配信予約システム
15日前
個人
テレビ会議拡張システム
3か月前
日本精機株式会社
投影システム
2か月前
サクサ株式会社
中継装置
22日前
日本無線株式会社
音声通信方式
2か月前
キヤノン株式会社
撮像装置
1か月前
キヤノン株式会社
電子機器
14日前
キヤノン株式会社
通信装置
2か月前
日本精機株式会社
車両用表示装置
2か月前
電気興業株式会社
無線中継器
1か月前
キヤノン電子株式会社
画像読取装置
2か月前
キヤノン電子株式会社
モバイル装置
22日前
個人
補聴器のイヤピース耳穴挿入具
2か月前
キヤノン電子株式会社
画像読取装置
2か月前
キヤノン電子株式会社
画像読取装置
3か月前
ヤマハ株式会社
信号処理装置
1か月前
日本精機株式会社
画像投映システム
24日前
ヤマハ株式会社
音響出力装置
3か月前
ヤマハ株式会社
音響出力装置
3か月前
キヤノン株式会社
画像処理装置
2か月前
株式会社ヴィーネックス
カメラ
2か月前
株式会社シグマ
撮像素子及び撮像装置
2か月前
株式会社ニコン
撮像装置
2日前
キヤノン株式会社
画像処理装置
1か月前
日本放送協会
映像伝送システム
2か月前
キヤノン株式会社
撮影システム
2か月前
キヤノン株式会社
映像表示装置
3か月前
キヤノン株式会社
画像読取装置
3か月前
キヤノン株式会社
通信システム
1か月前
リオン株式会社
電気機械変換器
2か月前
キヤノン株式会社
画像表示装置
1か月前
オムロン株式会社
スレーブ装置
3か月前
シャープ株式会社
表示装置
2か月前
株式会社クーネル
音響装置
1か月前
続きを見る