TOP特許意匠商標
特許ウォッチ Twitter
公開番号2025122810
公報種別公開特許公報(A)
公開日2025-08-22
出願番号2024018478
出願日2024-02-09
発明の名称音質改善装置、音質改善方法及びプログラム
出願人公立大学法人広島市立大学
代理人個人,個人,個人
主分類G10L 21/0308 20130101AFI20250815BHJP(楽器;音響)
要約【課題】複数の音が混在する音響信号から分離抽出される音の音質を向上することができる音質改善装置、音質改善方法及びプログラムを提供することを目的とする。
【解決手段】音質改善装置1は、分離部10と、推定部20と、を備える。分離部10は、複数の音源(第1音源O1、第2音源O2)それぞれから発せられた音の合成音を、異なる位置(マイク2A、2B)でそれぞれ録音することにより得られた第1音響信号SA1(t)、SB1(t)に対して独立成分分析を行って、音源毎の第2音響信号SA2(t)、SB2(t)に分離する。推定部20は、第1音響信号SB1(t)及び第2音響信号SA2(t)に対してそれぞれ非負値行列因子分解を行って、音源に対応する第3音響信号S3(t)を、複数の音源(第1音源O1、第2音源O2)のうち、少なくとも1つの音源について推定する。
【選択図】図1
特許請求の範囲【請求項1】
複数の音源それぞれから発せられた音の合成音を、異なる位置でそれぞれ録音することにより得られた第1音響信号に対して独立成分分析を行って、音源毎の第2音響信号に分離する分離部と、
前記第1音響信号及び前記第2音響信号に対してそれぞれ非負値行列因子分解を行って、音源に対応する第3音響信号を、前記複数の音源のうち、少なくとも1つの音源について推定する推定部と、
を備える音質改善装置。
続きを表示(約 930 文字)【請求項2】
非負値行列因子分解は、前記第1音響信号又は前記第2音響信号を、そのスペクトルパターンを示す基底行列と、前記スペクトルパターンの時間的な強度変化を示すアクティベーション行列とに分解する処理であり、
前記推定部は、
前記複数の音源のうちの第1音源に対応する前記第2音響信号を教師信号として、非負値行列因子分解を行って、前記第1音源に対応する前記基底行列を推定し、
前記第1音響信号に対して、非負値行列因子分解を行って、推定された前記基底行列に基づいて、前記第1音源に対応するアクティベーション行列と、前記複数の音源のうちの第2音源に対応する基底行列及びアクティベーション行列とを推定し、
推定された前記第1音源に対応する前記基底行列及びアクティベーション行列に基づいて、前記第1音源に対応する前記第3音響信号を生成するか、推定された前記第2音源に対応する前記基底行列及びアクティベーション行列に基づいて、前記第2音源に対応する前記第3音響信号を生成する、
請求項1に記載の音質改善装置。
【請求項3】
情報処理装置によって実行される音質改善方法であって、
複数の音源それぞれから発せられた音の合成音を、異なる位置でそれぞれ録音することにより得られた第1音響信号に対して独立成分分析を行って、音源毎の第2音響信号に分離し、
前記第1音響信号及び前記第2音響信号に対してそれぞれ非負値行列因子分解を行って、音源に対応する第3音響信号を、前記複数の音源のうち、少なくとも1つの音源について推定する、
音質改善方法。
【請求項4】
コンピュータを、
複数の音源それぞれから発せられた音の合成音を、異なる位置でそれぞれ録音することにより得られた第1音響信号に対して独立成分分析を行って、音源毎の第2音響信号に分離する分離部、
前記第1音響信号及び前記第2音響信号に対してそれぞれ非負値行列因子分解を行って、音源に対応する第3音響信号を、前記複数の音源のうち、少なくとも1つの音源について推定する推定部、
として機能させるプログラム。

発明の詳細な説明【技術分野】
【0001】
本発明は、音質改善装置、音質改善方法及びプログラムに関する。
続きを表示(約 2,000 文字)【背景技術】
【0002】
ICA(独立成分分析)により、複数の音源から発せられる音が混在する音響信号から、1つの音源に対応する音響信号を分離する音源分離を行う試みが行われている。さらには、半教師あり非負値行列因子分解により、複数の音源から発せられる音が混在する音響信号から1つの音源に対応する音響信号を分離してさらに高音質な音響信号を生成する試みが行われている(非特許文献1)。
【先行技術文献】
【非特許文献】
【0003】
北村大地、小野順貴、猿渡洋、高橋祐、近藤多伸、”半教師あり非負値行列因子分解における音源分離性能向上のための効果的な基底学習法” IEICE Technical Report, EA2015-130, vol. 115, no. 521, pp. 355-360, March 2016.
【発明の概要】
【発明が解決しようとする課題】
【0004】
ICAは高音質な音源分離を実現できる一方、各音源における分布の歪みを必要とする。これを逆に説明すると、分布の歪みを生じない音源に対してICAはうまく音響信号を分離することができない。一方、半教師あり非負値行列因子分解を行っても、音の消し残りや、分離不可能な状態が起こり得る。
【0005】
本発明は、上記実情の下になされたものであり、複数の音が混在する音響信号から分離抽出される音の音質を向上することができる音質改善装置、音質改善方法及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
上記目的を達成するために、本発明の第1の観点に係る音質改善装置は、
複数の音源それぞれから発せられた音の合成音を、異なる位置でそれぞれ録音することにより得られた第1音響信号に対して独立成分分析を行って、音源毎の第2音響信号に分離する分離部と、
前記第1音響信号及び前記第2音響信号に対してそれぞれ非負値行列因子分解を行って、音源に対応する第3音響信号を、前記複数の音源のうち、少なくとも1つの音源について推定する推定部と、
を備える。
【0007】
この場合、非負値行列因子分解は、前記第1音響信号又は前記第2音響信号を、そのスペクトルパターンを示す基底行列と、前記スペクトルパターンの時間的な強度変化を示すアクティベーション行列とに分解する処理であり、
前記推定部は、
前記複数の音源のうちの第1音源に対応する前記第2音響信号を教師信号として、非負値行列因子分解を行って、前記第1音源に対応する前記基底行列を推定し、
前記第1音響信号に対して、非負値行列因子分解を行って、推定された前記基底行列に基づいて、前記第1音源に対応するアクティベーション行列と、前記複数の音源のうちの第2音源に対応する基底行列及びアクティベーション行列とを推定し、
推定された前記第1音源に対応する前記基底行列及びアクティベーション行列に基づいて、前記第1音源に対応する前記第3音響信号を生成するか、推定された前記第2音源に対応する前記基底行列及びアクティベーション行列に基づいて、前記第2音源に対応する前記第3音響信号を生成する、
こととしてもよい。
【0008】
本発明の第2の観点に係る音質改善方法は、
情報処理装置によって実行される音質改善方法であって、
複数の音源それぞれから発せられた音の合成音を、異なる位置でそれぞれ録音することにより得られた第1音響信号に対して独立成分分析を行って、音源毎の第2音響信号に分離し、
前記第1音響信号及び前記第2音響信号に対してそれぞれ非負値行列因子分解を行って、音源に対応する第3音響信号を、前記複数の音源のうち、少なくとも1つの音源について推定する。
【0009】
本発明の第3の観点に係るプログラムは、
コンピュータを、
複数の音源それぞれから発せられた音の合成音を、異なる位置でそれぞれ録音することにより得られた第1音響信号に対して独立成分分析を行って、音源毎の第2音響信号に分離する分離部、
前記第1音響信号及び前記第2音響信号に対してそれぞれ非負値行列因子分解を行って、音源に対応する第3音響信号を、前記複数の音源のうち、少なくとも1つの音源について推定する推定部、
として機能させる。
【発明の効果】
【0010】
本発明によれば、複数の音が混在する音響信号から分離抽出される音の音質を向上することができる。
【図面の簡単な説明】
(【0011】以降は省略されています)

この特許をJ-PlatPat(特許庁公式サイト)で参照する

関連特許