TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025110025
公報種別公開特許公報(A)
公開日2025-07-28
出願番号2024003705
出願日2024-01-15
発明の名称映像符号化装置、映像復号装置、映像符号化方法、および映像復号方法
出願人日本電気株式会社
代理人個人,個人
主分類H04N 19/463 20140101AFI20250718BHJP(電気通信技術)
要約【課題】確率分布の推定ができなくなる状況を回避する。
【解決手段】映像符号化装置50は、符号化対象テンソルから複数の縮小領域のテンソルを生成する縮小手段51と、複数の縮小領域のテンソルを入力して、各々の確率分布を推定する複数の確率分布推定手段52と、符号化対象テンソルと複数の縮小領域のテンソルとを、確率分布を使用してエントロピー符号化して、ビットストリームを生成するエントロピー符号化手段53と、ビットストリームを多重化する多重化手段54とを備え、エントロピー符号化手段53は、符号化対象テンソルまたは縮小領域よりも小さいサイズの縮小領域のテンソルから推定される確率分布を使用し、符号化対象テンソルのサイズが所定サイズ(例えば、最小サイズ)よりも小さい場合に、当該サイズと所定サイズとの差以上のダミーデータを符号化対象テンソルに付加するパディング手段55を備える。
【選択図】図16
特許請求の範囲【請求項1】
符号化対象テンソルから複数の縮小領域のテンソルを生成する縮小手段と、
前記複数の縮小領域のテンソルを入力して、各々の確率分布を推定する複数の確率分布推定手段と、
前記符号化対象テンソルと前記複数の縮小領域のテンソルとを、前記確率分布を使用してエントロピー符号化して、ビットストリームを生成するエントロピー符号化手段と、
前記ビットストリームを多重化する多重化手段とを備え、
前記エントロピー符号化手段は、前記符号化対象テンソルまたは前記縮小領域よりも小さいサイズの縮小領域のテンソルから推定される確率分布を使用し、
前記符号化対象テンソルのサイズが所定サイズよりも小さい場合に、当該サイズと前記所定サイズとの差以上のダミーデータを前記符号化対象テンソルに付加するパディング手段を備える
映像符号化装置。
続きを表示(約 2,400 文字)【請求項2】
前記エントロピー符号化手段は、ダミーデータを符号化の対象としない
請求項1に記載の映像符号化装置。
【請求項3】
前記エントロピー符号化手段は、符号化対象の前記符号化対象テンソルまた前記縮小領域のサイズに最も近いサイズの縮小領域のテンソルから推定される確率分布を使用する
請求項1または請求項2に記載の映像符号化装置。
【請求項4】
前記エントロピー符号化手段は、最小の縮小領域のテンソルを、あらかじめ決められた固定確率分布を使用してエントロピー符号化する
請求項3に記載の映像符号化装置。
【請求項5】
符号化対象テンソルと該符号化対象テンソルから生成された複数の縮小領域のテンソルとが、確率分布を使用してエントロピー符号化されて生成されたビットストリームが多重化された多重化ビットストリームの多重化を解除する多重化解除手段と、
前記符号化対象テンソルと前記複数の縮小領域のテンソルとを対象として、確率分布を使用してエントロピー復号を行うエントロピー復号手段と、
前記エントロピー復号によって得られる複数のテンソルを合成する合成手段とを備え、
映像符号化時には、前記符号化対象テンソルのサイズが所定サイズよりも小さい場合に、当該サイズと前記所定サイズとの差以上のダミーデータが前記符号化対象テンソルに付加されるパディング制御がなされており、
前記エントロピー復号手段は、復号対象の前記符号化対象テンソルまたは前記縮小領域よりも小さいサイズの縮小領域のテンソルから推定される確率分布を使用する
映像復号装置。
【請求項6】
復号対象テンソルのサイズに基づいて、パディング制御がなされたか否か判定する判定手段を備える
請求項5に記載の映像復号装置。
【請求項7】
符号化対象テンソルから複数の縮小領域のテンソルを生成する縮小処理を実行し、
前記複数の縮小領域のテンソルを入力して、各々の確率分布を推定し、
前記符号化対象テンソルと前記複数の縮小領域のテンソルとを、前記確率分布を使用してエントロピー符号化して、ビットストリームを生成し、
前記ビットストリームを多重化し、
前記エントロピー符号化するときに、前記符号化対象テンソルまたは前記縮小領域よりも小さいサイズの縮小領域のテンソルから推定される確率分布を使用し、
前記符号化対象テンソルのサイズが所定サイズよりも小さい場合に、当該サイズと前記所定サイズとの差以上のダミーデータを前記符号化対象テンソルに付加する
映像符号化方法。
【請求項8】
符号化対象テンソルと該符号化対象テンソルから生成された複数の縮小領域のテンソルとが、確率分布を使用してエントロピー符号化されて生成されたビットストリームが多重化された多重化ビットストリームの多重化を解除し、
前記符号化対象テンソルと前記複数の縮小領域のテンソルとを対象として、確率分布を使用してエントロピー復号を行い、
前記エントロピー復号によって得られる複数のテンソルを合成し、
映像符号化時には、前記符号化対象テンソルのサイズが所定サイズよりも小さい場合に、当該サイズと前記所定サイズとの差以上のダミーデータが前記符号化対象テンソルに付加されるパディング制御がなされており、
前記エントロピー復号を行うときに、復号対象の前記符号化対象テンソルまたは前記縮小領域よりも小さいサイズの縮小領域のテンソルから推定される確率分布を使用する
映像復号方法。
【請求項9】
コンピュータに、
符号化対象テンソルから複数の縮小領域のテンソルを生成する縮小処理と、
前記複数の縮小領域のテンソルを入力して、各々の確率分布を推定する処理と、
前記符号化対象テンソルと前記複数の縮小領域のテンソルとを、前記確率分布を使用してエントロピー符号化して、ビットストリームを生成する処理と、
前記ビットストリームを多重化する処理とを実行させ、
前記エントロピー符号化するときに、前記符号化対象テンソルまたは前記縮小領域よりも小さいサイズの縮小領域のテンソルから推定される確率分布を使用させ、
前記符号化対象テンソルのサイズが所定サイズよりも小さい場合に、当該サイズと前記所定サイズとの差以上のダミーデータを前記符号化対象テンソルに付加させる
ための映像符号化プログラム。
【請求項10】
コンピュータに、
符号化対象テンソルと該符号化対象テンソルから生成された複数の縮小領域のテンソルとが、確率分布を使用してエントロピー符号化されて生成されたビットストリームが多重化された多重化ビットストリームの多重化を解除する処理と、
前記符号化対象テンソルと前記複数の縮小領域のテンソルとを対象として、確率分布を使用してエントロピー復号を行う処理と、
前記エントロピー復号によって得られる複数のテンソルを合成する処理とを実行させ、
映像符号化時には、前記符号化対象テンソルのサイズが所定サイズよりも小さい場合に、当該サイズと前記所定サイズとの差以上のダミーデータが前記符号化対象テンソルに付加されるパディング制御がなされており、
前記コンピュータに、前記エントロピー復号を行うときに、復号対象の前記符号化対象テンソルまたは前記縮小領域よりも小さいサイズの縮小領域のテンソルから推定される確率分布を使用させる
ための映像復号プログラム。

発明の詳細な説明【技術分野】
【0001】
本開示は、ニューラルネットワークを利用する映像符号化装置、映像復号装置、映像符号化方法、および映像復号方法に関する。
続きを表示(約 1,600 文字)【背景技術】
【0002】
ニューラルネットワークの一つである自己符号化器(Auto-encoder)、量子化、および、エントロピー符号化を組合せた新たな映像符号化技術が、非特許文献1に記載されている。
【0003】
自己符号化器は、入力データを、重要な特徴だけを含むように、低次元の特徴テンソルに圧縮する。その後、自己符号化器は、低次元の特徴テンソルを元の次元に再構築した再構築データを生成する。低次元の特徴テンソルに落とし込む処理(前半部分)をエンコードと呼ぶ。再構築データを生成する処理(後半部分)をデコードと呼ぶ。
【0004】
自己符号化器の学習は、再構築誤差(入力データと再構築データとの差)を最小化するように進められる。有意義な特徴量が得られるように、自己符号化器は、エンコードの構造に制約を加えたり、ネットワークの損失関数に正則化項を追加するように設計される。
【0005】
非特許文献2には、所定のテンソルを入力し、確率モデル(すなわち、予測の確率分布)を使用して入力テンソルをエントロピー符号化する手法が記載されている。この手法では、まず、入力テンソルをダウンサンプリングすることにより、入力テンソルのスケールよりも小さいスケールのテンソルを獲得する。獲得したテンソルから確率分布を推定し、そのテンソルをエントロピー符号化する。その後、その推定した確率分布を用いて入力テンソルをエントロピー符号化する。そのような手法を、MSPSM(Multi-Scale Progressive Statistical Model)エントロピー符号化と呼ぶ。MSPSMエントロピー符号化を、単に、MSPSMと表記する。
【0006】
以下、所定のテンソルとして、自己符号化器におけるエンコーダが出力するテンソルに量子化を適用することにより得られる特徴テンソルを例にする。
【先行技術文献】
【非特許文献】
【0007】
J. Ball’e, V. Laparra, and E. P. Simoncelli, "End-to-end Optimized Image Compression", published as a conference paper at ICLR 2017
N. Le et al., "Learned Image Coding for Machines: A Content-Adaptive Approach", IEEE International Conference on Multimedia and Expo (ICME), 2021
【発明の概要】
【発明が解決しようとする課題】
【0008】
図1は、MSPSMの実現例を示すブロック図である。図1に示す構成を、MSPSMシステムとする。
【0009】
MSPSMシステムは、エンコーダからの入力特徴テンソルをダウンサンプリングする。MSPSMシステムは、ダウンサンプリングで得られる特徴テンソルを、さらにダウンサンプリングする。MSPSMシステムは、ダウンサンプリングで得られる特徴テンソルのダウンサンプリングを繰り返す。i回目のダウンサンプリングで得られる特徴テンソルを、スケールiの特徴テンソルという。iを、スケール数という。
【0010】
スケールiの特徴テンソルを、y

と表現することがある。スケールiの特徴テンソルから推定された確率分布をp

と表現し、p

を推定した際のコンテキスト情報をz

と表現する。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

日本電気株式会社
電子装置
9日前
日本電気株式会社
システム及び方法
10日前
日本電気株式会社
情報処理システム及びその方法
1日前
日本電気株式会社
電子装置及びネットワークシステム
9日前
日本電気株式会社
測定装置、測定方法及びプログラム
5日前
日本電気株式会社
測定装置、測定方法及びプログラム
5日前
日本電気株式会社
検証可能証明書システム、方法、記録媒体
2日前
日本電気株式会社
判定装置、判定方法、及び判定プログラム
10日前
日本電気株式会社
情報生成装置、情報生成方法およびプログラム
8日前
日本電気株式会社
情報処理装置、情報処理方法、及びプログラム
5日前
日本電気株式会社
配送管理装置、配送管理方法、及びプログラム
16日前
日本電気株式会社
画像生成装置、画像生成方法及び、プログラム
8日前
日本電気株式会社
光通信システム、光信号制御方法及び光通信装置
25日前
日本電気株式会社
光ネットワークシステム、制御方法、プログラム
24日前
日本電気株式会社
測位方法、移動体、プログラム及び測位システム
24日前
日本電気株式会社
情報処理装置、情報処理方法、及び、プログラム
25日前
日本電気株式会社
情報処理システム、情報処理方法及びプログラム
2日前
日本電気株式会社
サーバ装置、サーバ装置の制御方法及びプログラム
3日前
日本電気株式会社
サーバ装置、サーバ装置の制御方法及びプログラム
4日前
日本電気株式会社
サーバ装置、サーバ装置の制御方法及びプログラム
1日前
日本電気株式会社
サーバ装置、サーバ装置の制御方法及びプログラム
1日前
日本電気株式会社
調査装置、通信システム、調査方法、及びプログラム
4日前
日本電気株式会社
電子決済支援装置、システム、方法、及びプログラム
1日前
日本電気株式会社
通信システム、監視装置、監視方法、及びプログラム
23日前
NECソリューションイノベータ株式会社
処理装置
8日前
日本電気株式会社
遅延予測システム、遅延予測装置、及び遅延予測方法
4日前
日本電気株式会社
光空間通信装置、光空間通信方法、およびプログラム
4日前
日本電気株式会社
光ファイバ監視システム、遠隔監視装置及び光ファイバ監視方法
8日前
日本電気株式会社
情報処理装置、情報処理システム、情報処理方法、及びプログラム
9日前
日本電気株式会社
情報処理装置、情報処理システム、情報処理方法、及びプログラム
5日前
日本電気株式会社
送電制御装置、送信装置、送電制御方法、送信方法、及びプログラム
4日前
日本電気株式会社
映像符号化装置、映像復号装置、映像符号化方法、および映像復号方法
5日前
日本電気株式会社
通信制御装置、通信システム、通信制御プログラム、及び通信制御方法
24日前
日本電気株式会社
映像符号化装置、映像復号装置、映像符号化方法、および映像復号方法
5日前
日本電気株式会社
映像符号化装置、映像復号装置、映像符号化方法、および映像復号方法
5日前
日本電気株式会社
映像符号化装置、映像復号装置、映像符号化方法、および映像復号方法
5日前
続きを見る