TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025090767
公報種別公開特許公報(A)
公開日2025-06-17
出願番号2025040107,2023111288
出願日2025-03-13,2018-08-10
発明の名称時間領域ステレオエンコーディング及びデコーディング方法並びに関連製品
出願人華為技術有限公司,HUAWEI TECHNOLOGIES CO.,LTD.
代理人個人,個人
主分類G10L 19/008 20130101AFI20250610BHJP(楽器;音響)
要約【課題】エンコーディング及びデコーディング品質を改善する時間領域ステレオエンコーディング方法及びデコーディング方法並びに関連製品を提供する。
【解決手段】オーディオエンコーディング方法は、現在フレームの符号化モードを決定し、現在フレームの符号化モードが反相関信号符号化モードであるとき、反相関信号符号化モードに対応する時間領域ダウンミックス処理方式を用いて現在フレームの左及び右チャンネル信号上で時間領域ダウンミックス処理を実行し、現在フレームのプライマリ及びセカンダリチャンネル信号を取得する。時間領域ダウンミックス処理方式は、反相関信号チャンネル組み合わせスキームに対応する。反相関信号チャンネル組み合わせスキームは、逆位相に近い信号に対応するチャンネル組み合わせスキームである。方法はさらに、現在フレームの取得されたプライマリ及びセカンダリチャンネル信号をエンコードする。
【選択図】図4
特許請求の範囲【請求項1】
現在のフレームのコーディングモードを決定するステップと、
前記現在のフレームの前記コーディングモードが反相関信号コーディングモードであると決定するとき、前記反相関信号コーディングモードに対応する時間領域ダウンミックス処理方式を用いることによって前記現在のフレームにおける左及び右チャンネル信号上での時間領域ダウンミックス処理を実行して、前記現在のフレームにおけるプライマリ及びセカンダリチャンネル信号を取得するステップであって、前記反相関信号コーディングモードに対応する前記時間領域ダウンミックス処理方式は、反相関信号チャンネル組み合わせスキームに対応する時間領域ダウンミックス処理方式であり、前記反相関信号チャンネル組み合わせスキームは、逆位相に近い信号に対応するチャンネル組み合わせスキームである、ステップと、
前記現在のフレームにおける前記取得されたプライマリ及びセカンダリチャンネル信号をエンコードするステップと、
を含む、音声符号化方法。
続きを表示(約 5,900 文字)【請求項2】
前記反相関信号コーディングモードに対応する時間領域ダウンミックス処理方式を用いることによって、前記現在のフレームにおける左及び右チャンネル信号上での時間領域ダウンミックス処理を実行し、前記現在のフレームにおけるプライマリ及びセカンダリチャンネル信号を取得する前記ステップは、
前記現在のフレームに対する前記反相関信号チャンネル組み合わせスキームのチャンネル組み合わせ比係数に基づいて、前記現在のフレームにおける前記左及び右チャンネル信号上での時間領域ダウンミックス処理を実行するステップ、又は、
前記現在のフレームに対する前記反相関信号チャネル組み合わせスキームの前記チャンネル組み合わせ比係数、及び前のフレームに対する前記反相関信号チャンネル組み合わせスキームのチャンネル組み合わせ比係数に基づいて、前記現在のフレームにおける前記左及び右チャンネル信号上での時間領域ダウンミックス処理を実行し、前記現在のフレームにおける前記プライマリ及びセカンダリチャンネル信号を取得するステップ
を含む、請求項1に記載の方法。
【請求項3】
前記現在のフレームにおける前記プライマリ及びセカンダリチャンネル信号を取得するために、前記現在のフレームに対する前記反相関信号チャンネル組み合わせスキームの前記チャンネル組み合わせ比係数に基づいて、前記現在のフレームにおける前記左及び右チャンネル信号上での時間領域ダウンミックス処理が実行されるとき、
TIFF
2025090767000283.tif
16
44
であり、ここで、

L
(n)は、前記現在のフレームにおける前記左チャンネル信号を示し、X
R
(n)は、前記現在のフレームにおける前記右チャンネル信号を示し、Y(n)は、前記現在のフレーム内にあり、且つ前記時間領域ダウンミックス処理を通して取得される前記プライマリチャンネル信号を示し、X(n)は、前記現在のフレーム内にあり、且つ前記時間領域ダウンミックス処理を通して取得される前記セカンダリチャンネル信号を示し、
nは、サンプリング点の番号を示し、M
22
は、前記現在のフレームに対する前記反相関信号チャンネル組み合わせスキームに対応するダウンミックス行列を示し、M
22
は、前記現在のフレームに対する前記反相関信号チャンネル組み合わせスキームに対応する前記チャンネル組み合わせ比係数に基づいて構築される、
請求項2に記載の方法。
【請求項4】
前記現在のフレームにおける前記プライマリ及びセカンダリチャンネル信号を取得するために、前記現在のフレームに対する前記反相関信号チャンネル組み合わせスキームの前記チャンネル組み合わせ比係数、及び前記前のフレームに対する前記反相関信号チャンネル組み合わせスキームの前記チャンネル組み合わせ比計数に基づいて、前記現在のフレームにおける前記左及び右チャンネル信号上で時間領域ダウンミックス処理が実行されるとき、
0≦n<N-delay_comである場合、
TIFF
2025090767000284.tif
15
48
であり、又は、
N-delay_com≦n<Nである場合、
TIFF
2025090767000285.tif
15
50
であり、ここで、

L
(n)は、前記現在のフレームにおける前記左チャンネル信号を示し、X
R
(n)は、前記現在のフレームにおける前記右チャンネル信号を示し、Y(n)は、前記現在のフレーム内にあり、且つ前記時間領域ダウンミックス処理を通して取得される前記プライマリチャンネル信号を示し、X(n)は、前記現在のフレーム内にあり、且つ前記時間領域ダウンミックス処理を通して取得される前記セカンダリチャンネル信号を示し、nは、サンプリング点の番号を示し、delay_comは、エンコーディング遅延補償を示し、

22
は、前記現在のフレームに対する前記反相関信号チャンネル組み合わせスキームに対応するダウンミックス行列を示し、M
22
は、前記現在のフレームに対する前記反相関信号チャンネル組み合わせスキームに対応する前記チャンネル組み合わせ比係数に基づいて構築され、

12
は、前記前のフレームに対する前記反相関信号チャンネル組み合わせスキームに対応するダウンミックス行列を示し、M
12
は、前記前のフレームに対する前記反相関信号チャンネル組み合わせスキームに対応する前記チャンネル組み合わせ比係数に基づいて構築される、
請求項2に記載の方法。
【請求項5】
前記現在のフレームにおける前記プライマリ及びセカンダリチャンネル信号を取得するために、前記現在のフレームに対する前記反相関信号チャンネル組み合わせスキームの前記チャンネル組み合わせ比係数、及び前記前のフレームに対する前記反相関信号チャンネル組み合わせスキームの前記チャンネル組み合わせ比係数に基づいて、前記現在のフレームにおける前記左及び右チャンネル信号上で時間領域ダウンミックス処理が実行されるとき、
0≦n<N-delay_comである場合、
TIFF
2025090767000286.tif
14
45
であり、又は、
N-delay_com≦n<N-delay_com+NOVA_1である場合、
TIFF
2025090767000287.tif
15
120
であり、又は、
N-delay_com+NOVA_1≦n<Nである場合、
TIFF
2025090767000288.tif
15
68
であり、ここで、
fade_in(n)は、フェードイン係数を示し、
TIFF
2025090767000289.tif
13
61
であり、fade_out(n)は、フェードアウト係数を示し、
TIFF
2025090767000290.tif
13
69
であり、NOVA_1は、移行処理長を示し、nは、サンプリング点の番号を示し、n=0,1,…,N-1であり、X
L
(n)は、前記現在のフレームにおける前記左チャンネル信号を示し、X
R
(n)は、前記現在のフレームにおける前記右チャンネル信号を示し、Y(n)は、前記現在のフレーム内であり、且つ前記時間領域ダウンミックス処理を通して取得される前記プライマリチャンネル信号を示し、X(n)は、前記現在のフレーム内であり、且つ前記時間領域ダウンミックス処理を通して取得される前記セカンダリチャンネル信号を示し、delay_comは、エンコーディング遅延補償を示し、

22
は、前記現在のフレームに対する前記反相関信号チャンネル組み合わせスキームに対応するダウンミックス行列を示し、M
22
は、前記現在のフレームに対する前記反相関信号チャンネル組み合わせスキームに対応する前記チャンネル組み合わせ比係数に基づいて構築され、

12
は、前記前のフレームに対する前記反相関信号チャンネル組み合わせスキームに対応するダウンミックス行列を示し、M
12
は、前記前のフレームに対する前記反相関信号チャンネル組み合わせスキームに対応する前記チャンネル組み合わせ比係数に基づいて構築される、
請求項2に記載の方法。
【請求項6】
TIFF
2025090767000291.tif
13
33
又は
TIFF
2025090767000292.tif
16
33
又は
TIFF
2025090767000293.tif
13
39
又は
TIFF
2025090767000294.tif
16
36
又は
TIFF
2025090767000295.tif
13
39
又は
TIFF
2025090767000296.tif
16
36
であり、ここで、α
1
=ratio_SM、α
2
=1-ratio_SMであり、ratio_SMは、前記現在のフレームに対する前記反相関信号チャンネル組み合わせスキームに対応する前記チャンネル組み合わせ比係数を示す、
請求項3~5のいずれか1項に記載の方法。
【請求項7】
TIFF
2025090767000297.tif
13
46
又は
TIFF
2025090767000298.tif
16
44
又は
TIFF
2025090767000299.tif
13
39
又は
TIFF
2025090767000300.tif
16
36
又は
TIFF
2025090767000301.tif
13
39
又は
TIFF
2025090767000302.tif
16
36
であり、ここで、α
1_pre
=tdm_last_ratio_SM、α
2_pre
=1-tdm_last_ratio_SMであり、tdm_last_ratio_SMは、前記前のフレームに対する前記反相関信号チャンネル組み合わせスキームに対応する前記チャンネル組み合わせ比係数を示す、
請求項3~6のいずれか1項に記載の方法。
【請求項8】
TIFF
2025090767000303.tif
18
41
又は
TIFF
2025090767000304.tif
18
46
又は
TIFF
2025090767000305.tif
18
41
であり、ここで、x
L
(n)は、前記現在のフレームにおける元の左チャンネル信号を示し、x
R
(n)は、前記現在のフレームにおける元の右チャンネル信号を示し、x
L_HP
(n)は、前記現在のフレームにおける時間領域前処理を受けた左チャンネル信号を示し、x
R_HP
(n)は、前記現在のフレームにおける時間領域前処理を受けた右チャンネル信号を示し、
x’
L
(n)は、前記現在のフレームにおける遅延アライメント処理を受けた左チャンネル信号を示し、x’
R
(n)は、前記現在のフレームにおける遅延アライメント処理を受けた右チャンネル信号を示す、
請求項3~7のいずれか1項に記載の方法。
【請求項9】
ビットストリームに基づいてデコーディングを実行して、現在のフレームにおけるデコードされたプライマリ及びセカンダリチャンネル信号を取得するステップと、
前記現在のフレームのデコーディングモードを決定するステップと、
前記現在のフレームの前記デコーディングモードが反相関信号デコーディングモードであると決定するとき、前記反相関信号デコーディングモードに対応する時間領域アップミックス処理方式を用いることによって、前記現在のフレームにおける前記デコードされたプライマリ及びセカンダリチャンネル信号上での時間領域アップミックス処理を実行し、前記現在のフレームにおける再構築された左及び右チャンネル信号を取得するステップであって、前記反相関信号デコーディングモードに対応する前記時間領域アップミックス処理方式は、反相関信号チャンネル組み合わせスキームに対応する時間領域アップミックス処理方式であり、前記反相関信号チャンネル組み合わせスキームは、逆位相に近い信号に対応するチャンネル組み合わせスキームである、ステップと、を含む、
ステレオデコーディング方法。
【請求項10】
前記反相関信号デコーディングモードに対応する時間領域アップミックス処理方式を用いることによって、前記現在のフレームにおける前記デコードされたプライマリ及びセカンダリチャンネル信号上での時間領域アップミックス処理を実行して、前記現在のフレームにおける再構築された左及び右チャンネル信号を取得する前記ステップは、
前記現在のフレームに対する前記反相関信号チャンネル組み合わせスキームのチャンネル組み合わせ比係数に基づいて、前記現在のフレームにおける前記デコードされたプライマリ及びセカンダリチャンネル信号上での時間領域アップミックス処理を実行し、前記現在のフレームにおける前記再構築された左及び右チャンネル信号を取得するステップ、又は
前記現在のフレームに対する前記反相関信号チャンネル組み合わせスキームの前記チャンネル組み合わせ比係数、及び前のフレームに対する前記反相関信号チャンネル組み合わせスキームのチャンネル組み合わせ比係数に基づいて、前記現在のフレームにおける前記デコードされたプライマリ及びセカンダリチャンネル信号上での時間領域アップミックス処理を実行して、前記現在のフレームにおける前記再構築された左及び右チャンネル信号を取得するステップ
を含む、請求項9に記載の方法。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本出願は、オーディオエンコーディング及びデコーディング技術の分野に関し、詳細には、時間領域ステレオエンコーディング及びデコーディング方法並びに関連製品に関する。
続きを表示(約 2,300 文字)【背景技術】
【0002】
生活の質が、向上したので、人々は、高品質オーディオに対するますます高い要求を有している。モノラルオーディオと比較して、ステレオオーディオは、様々な音源についての方向感及び分布感を有し、情報の明瞭性、了解度、及び存在感を改善することができ、したがって、人々に人気がある。
【0003】
パラメトリックステレオエンコーディング及びデコーディング技術においては、ステレオ信号は、モノラル信号と空間認知パラメータとに変換され、マルチチャンネル信号は、圧縮される。これは、一般的なステレオエンコーディング及びデコーディング技術である。しかしながら、パラメトリックステレオエンコーディング及びデコーディング技術においては、空間認知パラメータは、通常、周波数領域において抽出される必要があり、時間領域変換が、実行される必要があるので、コーデック全体の遅延は、相対的に大きい。したがって、遅延について、相対的に厳しい要件が、存在するとき、時間領域ステレオエンコーディング技術が、より良い選択である。
【0004】
従来の時間領域ステレオエンコーディング技術においては、信号は、時間領域において2つのモノラル信号を取得するために、ダウンミックスされる。例えば、MSエンコーディング技術においては、ミッドチャンネル(Mid channel)信号と、サイドチャンネル(Side channel)信号とを取得するために、左及び右チャンネル信号が、最初にダウンミックスされる。例えば、Lは、左チャンネル信号を示し、Rは、右チャンネル信号を示す。このケースにおいては、ミッドチャンネル信号は、0.5×(L+R)であり、ミッドチャンネル信号は、左チャンネルと右チャンネルとの間の相関についての情報を示し、サイドチャンネル信号は、0.5×(L-R)であり、サイドチャンネル信号は、左チャンネルと右チャンネルとの間の差についての情報を示す。その後、ミッドチャンネル信号とサイドチャンネル信号は、モノラルエンコーディング方法を使用することによって、別々にエンコードされ、ミッドチャンネル信号は、通常、より多量のビットを使用することによってエンコードされ、サイドチャンネル信号は、通常、より少量のビットを使用することによってエンコードされる。
【0005】
従来の時間領域ステレオエンコーディング技術が使用されるとき、ときどき、プライマリ信号のエネルギーは、きわめて小さく、又はエネルギーは、見当たりさえせず、最終的なエンコーディング品質の低下をもたらすことを、本出願の発明者らは、研究及び実践を通して見出した。
【発明の概要】
【0006】
本出願の実施形態は、時間領域ステレオエンコーディング方法及び関連製品を提供する。
【0007】
第1の態様に従うと、本出願の実施形態は、時間領域ステレオエンコーディング方法を提供し、方法は、現在のフレームのコーディングモードを決定するステップと、現在のフレームのコーディングモードが反相関信号コーディングモードであると決定されたとき、現在のフレームにおけるプライマリチャンネル信号(primary channel signal)及びセカンダリチャンネル信号(secondary channel signal)を取得するために、反相関信号コーディングモードに対応する時間領域ダウンミックス処理方式を使用することによって、現在のフレームにおける左及び右チャンネル信号に対して時間領域ダウンミックス処理を実行するステップであって、反相関信号コーディングモードに対応する時間領域ダウンミックス処理方式は、反相関信号チャンネル組み合わせスキームに対応する時間領域ダウンミックス処理方式であり、反相関信号チャンネル組み合わせスキームは、逆位相に近い信号に対応するチャンネル組み合わせスキームである、ステップと、現在のフレームにおける取得されたプライマリ及びセカンダリチャンネル信号をエンコードするステップとを含み得る。
【0008】
現在のフレームにおけるステレオ信号は、例えば、現在のフレームにおける左及び右チャンネル信号を含む。
【0009】
現在のフレームのコーディングモードは、複数のコーディングモードのうちの1つであり得る。例えば、現在のフレームのコーディングモードは、以下のコーディングモード、即ち、相関信号コーディングモード、反相関信号コーディングモード、相関から反相関信号符号化への切り換えモード、及び反相関から相関信号符号化への切り換えモードのうちの1つであり得る。
【0010】
上述のソリューションにおいては、現在のフレームのコーディングモードは、決定される必要があり、これは、現在のフレームのコーディングモードについて複数の可能性があることを示していることが理解され得る。ただ1つのコーディングモードしかない従来のソリューションと比較して、複数の可能なコーディングモードを有するこのソリューションは、複数の可能なシナリオとより相性が良く、調和することができる。加えて、逆位相に近い信号に対応するチャンネル組み合わせスキームが、導入されるので、現在のフレームにおけるステレオ信号が、逆位相に近い信号であるとき、より目標に合ったチャンネル組み合わせスキーム及びコーディングモードが、存在し、これは、エンコーディング品質を改善する助けになる。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

個人
グランドピアノの鍵盤支持構造
21日前
NOK株式会社
吸音構造体
13日前
株式会社ドクター中松創研
歌及び歌の制作方法
今日
株式会社ワコール
繊維構造体
12日前
個人
補助譜面台及び補助譜面台セット
24日前
株式会社大同工業所
警報器及び警報システム
13日前
トヨタ自動車株式会社
音声出力装置
21日前
株式会社第一興商
カラオケ装置
14日前
ヤマハ株式会社
管楽器用部品及び管楽器
20日前
TDK株式会社
振動デバイスおよびその振動方法
17日前
川上産業株式会社
吸音シート
4日前
ヤマハ株式会社
鍵盤装置用の鍵
6日前
株式会社エクサウィザーズ
情報処理方法、プログラム及び情報処理システム
13日前
株式会社エクシング
携帯端末用プログラム、及び、カラオケシステム
12日前
トヨタ自動車株式会社
車両用ホーンシステム
18日前
株式会社東芝
吸音装置及びパラメータ推定方法
21日前
ヤマハ株式会社
表示方法およびプログラム
20日前
株式会社パトライト
メール読み上げテキスト生成プログラム
4日前
ソニーグループ株式会社
情報処理装置、情報処理方法、およびプログラム
6日前
ピクシーダストテクノロジーズ株式会社
遮音システムおよび区画設備
6日前
トヨタ自動車株式会社
車両管理システム及び電気自動車
20日前
ヤマハ株式会社
音響処理方法、音響処理システムおよびプログラム
4日前
Strings Audio Lab合同会社
弦楽器保持装置及び単数又は複数弦楽器の配置方法
17日前
ローランド株式会社
楽譜出力プログラム、楽譜出力装置および楽譜出力方法
18日前
ローランド株式会社
楽譜出力プログラム、楽譜出力装置および楽譜出力方法
18日前
パナソニックIPマネジメント株式会社
録音装置、録音システム、及びそれらの録音方法
11日前
三菱重工業株式会社
単語登録方法および単語登録装置
13日前
トート、カロリ
擦弦楽器
13日前
株式会社SCREENホールディングス
測定記録装置、測定記録プログラム、および、測定記録方法
6日前
日本電信電話株式会社
音信号ダウンミックス方法、音信号ダウンミックス装置、プログラム
13日前
パナソニックオートモーティブシステムズ株式会社
音響システム、音響システム制御方法、および音響システム製造方法
今日
株式会社オルツ
会話の記録を生成するためのプログラム、システム、および方法
20日前
ドルビー・インターナショナル・アーベー
オーディオコーディングのためのマルチラグフォーマット
24日前
ドルビー・インターナショナル・アーベー
デコーダシステム、デコーディング方法及びコンピュータプログラム
18日前
チョーチアン ヘンイー ペトロケミカル カンパニー,リミテッド
オーディオに基づく設備の故障検出方法、装置、電子デバイス、記憶媒体及びプログラム
7日前
華為技術有限公司
時間領域ステレオエンコーディング及びデコーディング方法並びに関連製品
6日前
続きを見る