TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025085702
公報種別
公開特許公報(A)
公開日
2025-06-05
出願番号
2025039836,2024033809
出願日
2025-03-13,2011-04-06
発明の名称
デコーダシステム、デコーディング方法及びコンピュータプログラム
出願人
ドルビー・インターナショナル・アーベー
代理人
弁理士法人ITOH
主分類
G10L
19/008 20130101AFI20250529BHJP(楽器;音響)
要約
【課題】高ビットレートレンジにおいても計算効率の高いステレオ符号化をする方法と装置を提供する。
【解決手段】
本発明は、周波数領域における複素予測を用いたステレオ符号化及び復号の方法及び装置を提供する。一実施形態において、複素予測符号化によりエンコードされた、2つの入力チャンネルを表す第1の周波数領域表示を有する入力ステレオ信号から出力ステレオ信号を求める復号方法は、(i)第1の入力チャンネルの第2の周波数領域表示を計算するアップミキシングステップと、(ii)前記第1の入力チャンネルの第1と第2の周波数領域表示と、前記第2の入力チャンネルの第1の周波数領域表示と、複素予測係数とに基づいて、出力チャンネルを計算するアップミキシングステップとを有する。アップミキシングは制御データに応じて中断できる。
【選択図】図2
特許請求の範囲
【請求項1】
左チャネルと右チャネルとを有するステレオオーディオ信号を出力する装置であって、当該装置は、
オーディオビットストリームを受信し、前記オーディオビットストリームから少なくとも1つの予測係数をデコードするデマルチプレクサであって、前記オーディオビットストリームはフレームにセグメント化されており、前記少なくとも1つの予測係数の値は各フレームについて変化しうる、デマルチプレクサと、
前記オーディオビットストリームからダウンミックス信号と残差信号とを生成するように構成されたデコーダと、
予測モードまたは非予測モードで動作し、前記左チャネルと前記右チャネルとを前記ステレオオーディオ信号として出力するように構成されるアップミキサーとを有し、
前記アップミキサーが前記予測モードで動作するとき、前記残差信号はサイド信号と前記サイド信号を予測したものとの差分を表し、前記アップミキサーは前記ダウンミックス信号と、前記残差信号と、前記少なくとも1つの予測係数との組み合わせから、前記左チャネルと前記右チャネルとを生成し、
前記アップミキサーが前記非予測モードで動作するとき、前記残差信号は前記サイド信号を表し、前記アップミキサーは、前記ダウンミックス信号と前記残差信号との和に基づき前記左チャネルを生成し、前記ダウンミックス信号と前記残差信号との差に基づいて前記右チャネルを生成する、
装置。
続きを表示(約 820 文字)
【請求項2】
前記少なくとも1つの予測係数は前記残差信号のエネルギーを低減または最小化する、
請求項1に記載の装置。
【請求項3】
前記ダウンミックス信号に関連するノイズを成形するように構成されるノイズ成形器をさらに有し、前記ノイズ成形器は前記アップミキサーの上流に配置される、
請求項1に記載の装置。
【請求項4】
前記ノイズ成形器は時間にわたり前記ノイズを成形するように構成される時間的ノイズ成形器である、
請求項3に記載の装置。
【請求項5】
前記アップミキサーは、前記予測モードで動作するとき、3つのタップを有するフィルタを用いて前記左チャネルと前記右チャネルとを生成する、
請求項1に記載の装置。
【請求項6】
前記ダウンミックス信号は、元の左チャネルと元の右チャネルとの線形結合により形成されるミッド信号を含む、
請求項1に記載の装置。
【請求項7】
前記少なくとも1つの予測係数は実数値係数である、
請求項1に記載の装置。
【請求項8】
前記少なくとも1つの予測係数は複素数値係数である、
請求項1に記載の装置。
【請求項9】
前記アップミキサーは、前記ダウンミックス信号のバージョンを前記サイド信号のバージョンに加えて前記左チャネルを生成し、前記サイド信号の前記バージョンを前記ダウンミックス信号の前記バージョンから引いて前記右チャネルを生成することにより、前記サイド信号を前記ダウンミックス信号と結合する、
請求項1に記載の装置。
【請求項10】
前記アップミキサーは、前記予測モードで動作するとき、前記残差信号を前記サイド信号に加えるように構成される、請求項1に記載の装置。
(【請求項11】以降は省略されています)
発明の詳細な説明
【技術分野】
【0001】
ここに開示する発明は概してステレオオーディオ符号化に関し、より詳しくは周波数領域における複素予測を用いるステレオ符号化の手法に関する。
続きを表示(約 3,400 文字)
【背景技術】
【0002】
ステレオ信号の左(L)チャンネルと右(R)チャンネルの同時符号化(joint coding)により、LとRを独立に符号化するのと比較して、符号化が効率的になる。同時ステレオ符号化に対する一般的なアプローチはミッド/サイド(M/S)符号化である。ここで、ミッド(M)信号はL信号とR信号を加えることにより構成され、例えばM信号は
TIFF
2025085702000002.tif
9
170
により得られる。また、サイド(S)信号は2つのチャンネルLRを引くことにより構成され、例えばS信号は
TIFF
2025085702000003.tif
9
170
により得られる。M/S符号化の場合、L信号とR信号ではなく、M信号とS信号が符号化される。
【0003】
MPEG(Moving Picture Experts Group)のAAC(Advanced Audio Coding)標準(標準文書ISO/IEC 13818-7を参照)では、時間および周波数可変で、L/Rステレオ符号化とM/Sステレオ符号化を選択できる。このように、ステレオエンコーダは、ステレオ信号のある周波数帯域にL/R符号化を適用でき、そのステレオ信号の他の周波数帯域のエンコードにはM/S符号化が使われる(周波数可変)。さらに、エンコーダは時間的にL/R符号化とM/S符号化を切り替えられる(時間可変)。MPEG AACでは、ステレオエンコーディングは周波数領域で、より具体的にはMDCT(修正離散余弦変換)領域で行われる。これにより、周波数的および時間的に可変に、L/R符号化またはM/S符号化のいずれかを適応的に選択できる。
【0004】
パラメトリックステレオ符号化は、ステレオオーディオ信号を、モノラル信号と、ステレオパラメータとなる少量のサイド情報として、効率的に符号化する手法である。これはMPEG-4オーディオ標準(標準文書ISO/IEC14496-3を参照)の一部である。モノラル信号はどのオーディオ符号化器を用いてもエンコードできる。ステレオパラメータはモノビットストリーム(mono bit stream)の付属部分に組み込まれるので、完全に前方互換かつ後方互換となる。デコーダでは、モノラル信号が最初に復号され、その後にステレオパラメータを用いてステレオ信号が再構成される。復号されたモノ信号を無相関化した信号(decorrelated version)は、モノ信号との相互相関がゼロである。この無相関化信号を、無相関化器(decorrelator)により、例えば遅延ラインを含む適当なオールパスフィルタ(all-pass filter)により生成する。基本的に、無相関化信号はモノ信号と同じスペクトル的・時間的エネルギー分布を有する。モノラル信号は無相関化信号とともにアップミックスプロセスに入力される。このプロセスは、ステレオパラメータにより制御され、ステレオ信号を再構成する。さらに詳しい情報は、非特許文献1を参照されたい。
【0005】
MPEGサラウンド(MPS;ISO/IEC 23003-1及び非特許文献2を参照)は、パラメトリックステレオ符号化の原理に残差符号化の原理を組み合わせるものであり、無相関化信号を送信される残差で置き換え、知覚できる音質を改善している。残差符号化は、マルチチャンネル信号をダウンミックスし、任意的に空間的キューを抽出することにより行われる。ダウンミックスプロセスにおいて、エラー信号を表す残差信号が計算され、エンコードされて送信される。残差信号はデコーダにおいて無相関化信号の代わりになる。ハイブリッドアプローチでは、残差信号は一定の周波数帯域において、好ましくは比較的低い帯域において、無相関化信号に取って代わる。
【0006】
現在のMPEG Unified Speech and Audio Coding(USAC)システムは、図1に2つの例を示したが、デコーダはコアデコーダの下流に位置する複素値直交ミラーフィルタ(QMF)バンクを有する。このフィルタバンクの出力として得られるQMF表現は、複素値であり、それゆえ2倍にオーバーサンプルされており、ダウンミックス信号(すなわちミッド信号)Mと残差信号Dとして構成できる。これには複素値成分を有するアップミックス行列を使うことができる。(QMF領域の)L信号とR信号は
TIFF
2025085702000004.tif
13
170
として得られる。ここで、gは実数値のゲインファクタであり、αは複素値の予測係数である。αは残差信号Dのエネルギーが最小になるように選択するのが好ましい。ゲインファクタは規格化により、すなわち和信号のパワーが左右信号のパワーの和と等しくなるようにして決定できる。L信号とR信号それぞれの実部と虚部は互いに冗長性があり、原理的には一方を他方に基づき計算できる。しかし、後で可聴なエイリアシングアーティファクトを生ぜずにスペクトル帯域レプリケーション(SBR)デコーダを使えるという利益がある。モノ・ステレオアップミックスなどその他の時間または周波数適応的信号処理(図示せず)と関連するアーティファクトを防止する目的で、オーバーサンプルされた信号表現の利用も同様の理由で選択される。逆QMFフィルタリングがデコーダにおける最後の処理ステップである。信号の帯域制限的QMF表現により、帯域制限残差手法と「残差フィル」手法が使える。これらの手法をこのタイプのデコーダに組み込むことができる。
【0007】
上記の符号化構成は低ビットレートの場合、一般的には80kb/s未満の場合には良く適合するが、計算複雑性の点で高ビットレートの場合には最適なものではない。より詳しく言うと、高ビットレートでは、一般的にSBRツールは(符号化効率の改善にならないので)使われない次に、SBR段階を有さないデコーダでは、複素値アップミックス行列があるが故にQMFフィルタバンクを使うが、これは計算量が多く遅延を生じる(1024サンプルのフレーム長では、QMF分析/合成フィルタバンクにより961サンプルの遅延が生じる)。これは、もっと効率的な符号化構成の必要性を明らかに示している。
【先行技術文献】
【非特許文献】
【0008】
H. Purnhagen著「Low Complexity Parametric Stereo Coding in MPEG-4」, Proc. of the 7th Int. Conference on Digital Audio Effects (DAFx'04), Naples, Italy, October 5-8, 2004, pages 163-168
J. Herre et al.著「MPEG Surround - The ISO/MPEG Standard for Efficient and Compatible Multi- Channel Audio Coding」, Audio Engineering Convention Paper 7084, 122<nd> Convention, May 5-8, 2007
【発明の概要】
【課題を解決するための手段】
【0009】
本発明の一目的は、高ビットレートレンジにおいても計算効率の高いステレオ符号化をする方法と装置を提供することである。
【0010】
本発明は、独立請求項に規定した、符号化及び復号をするための、それぞれコーダ及びデコーダ、コーディング及びデコーディング方法、及びコンピュータプログラム製品を提供することにより、この目的を達成する。従属項は本発明の実施形態を規定している。
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
個人
グランドピアノの鍵盤支持構造
21日前
個人
音鳴らし具
25日前
NOK株式会社
吸音構造体
13日前
株式会社ワコール
繊維構造体
12日前
個人
補助譜面台及び補助譜面台セット
24日前
株式会社大同工業所
警報器及び警報システム
13日前
株式会社イノアックコーポレーション
防音材
26日前
トヨタ自動車株式会社
音声出力装置
21日前
株式会社第一興商
カラオケ装置
14日前
ヤマハ株式会社
管楽器用部品及び管楽器
20日前
TDK株式会社
振動デバイスおよびその振動方法
17日前
川上産業株式会社
吸音シート
4日前
ヤマハ株式会社
鍵盤装置用の鍵
6日前
株式会社エクサウィザーズ
情報処理方法、プログラム及び情報処理システム
13日前
株式会社エクシング
携帯端末用プログラム、及び、カラオケシステム
12日前
トヨタ自動車株式会社
車両用ホーンシステム
18日前
株式会社東芝
吸音装置及びパラメータ推定方法
21日前
株式会社 一歩
和音発生方法並びにそれに用いる単音発生具及び和音発生具
1か月前
ヤマハ株式会社
表示方法およびプログラム
20日前
株式会社パトライト
メール読み上げテキスト生成プログラム
4日前
株式会社半導体エネルギー研究所
音響装置
27日前
株式会社ユピテル
システム及びプログラム
27日前
ソニーグループ株式会社
情報処理装置、情報処理方法、およびプログラム
6日前
能美防災株式会社
警報ベル
27日前
カシオ計算機株式会社
電子楽器
27日前
トヨタ自動車株式会社
車両管理システム及び電気自動車
26日前
ピクシーダストテクノロジーズ株式会社
遮音システムおよび区画設備
6日前
株式会社ダイヘン
情報処理装置及びそれを用いた機器システム
27日前
トヨタ自動車株式会社
車両管理システム及び電気自動車
20日前
ヤマハ株式会社
音響処理方法、音響処理システムおよびプログラム
4日前
Strings Audio Lab合同会社
弦楽器保持装置及び単数又は複数弦楽器の配置方法
17日前
トヨタ自動車株式会社
車両制御方法、車両制御装置及び電気自動車
1か月前
ローランド株式会社
楽譜出力プログラム、楽譜出力装置および楽譜出力方法
18日前
ローランド株式会社
楽譜出力プログラム、楽譜出力装置および楽譜出力方法
18日前
パナソニックIPマネジメント株式会社
録音装置、録音システム、及びそれらの録音方法
11日前
三菱重工業株式会社
単語登録方法および単語登録装置
13日前
続きを見る
他の特許を見る