TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025123890
公報種別
公開特許公報(A)
公開日
2025-08-25
出願番号
2024019657
出願日
2024-02-13
発明の名称
収音装置、収音プログラム及び収音方法
出願人
沖電気工業株式会社
代理人
個人
,
個人
主分類
H04R
3/00 20060101AFI20250818BHJP(電気通信技術)
要約
【課題】 エリア収音処理でハングオーバ機能に対応しつつ目的音の発話終了後に妨害音の誤った抽出を抑制する。
【解決手段】 本発明は収音装置に関する。そして、本発明の収音装置は、複数のマイクロホンアレイのビームフォーマ出力に基づいて目的エリア音を抽出する手段と、目的エリア音判定値を取得する手段と、非目的エリア音判定値を取得する手段と、目的エリア音判定値と非目的エリア音判定値との比較結果に基づきハングオーバ長を制御する手段と、目的エリア音判定値に基づき目的エリア音区間であるか判定する目的エリア音区間判定処理を行い、目的エリア音区間である場合その時点からハングオーバ長の間は、目的エリア音区間判定処理の結果を目的エリア音区間であるという結果とする手段と、直近に行われた目的エリア音区間判定処理で入力信号が目的エリア音区間であると判定されている間のみ目的エリア音を出力する手段とを有することを特徴とする。
【選択図】 図1
特許請求の範囲
【請求項1】
複数のマイクロホンアレイの入力信号から目的エリアの方向に指向性を向けたビームフォーマ出力を取得し、それぞれの前記ビームフォーマ出力に基づいて前記目的エリアを音源とする目的エリア音を抽出する目的エリア音取得手段と、
前記目的エリア音に対する目的エリア音判定値を取得する目的エリア音判定値取得手段と、
前記目的エリア以外を音源とする非目的エリア音に対する非目的エリア音判定値を取得する非目的エリア音判定値取得手段と、
前記目的エリア音判定値と前記非目的エリア音判定値との比較結果に基づき、ハングオーバ長を制御するハングオーバ長制御手段と、
前記目的エリア音判定値に基づき、前記入力信号に所定の基準以上の前記目的エリア音の成分が含まれる目的エリア音区間であるか判定する目的エリア音区間判定処理を行い、前記目的エリア音区間判定処理で前記入力信号が目的エリア音区間であると判定された場合、その時点から前記ハングオーバ長制御手段が制御した前記ハングオーバ長の間は、前記目的エリア音区間判定処理の結果を目的エリア音区間であるという結果とする目的エリア音区間検出手段と、
直近に行われた前記目的エリア音区間判定処理で前記入力信号が目的エリア音区間であると判定されている間のみ前記目的エリア音を出力する出力手段と
を有することを特徴とする収音装置。
続きを表示(約 1,800 文字)
【請求項2】
前記ハングオーバ長制御手段は、前記目的エリア音判定値と前記非目的エリア音判定値の大きさを比較して、前記目的エリア音判定値の方が大きいほど前記ハングオーバ長を長く制御し、前記非目的エリア音判定値の方が大きいほど前記ハングオーバ長を短く制御することを特徴とする請求項1に記載の収音装置。
【請求項3】
前記非目的エリア音判定値取得手段は、前記入力信号から前記目的エリア音をスペクトル減算することで得られる信号に基づき、前記非目的エリア音判定値を取得することを特徴とする請求項1に記載の収音装置。
【請求項4】
前記ハングオーバ長制御手段は、前記入力信号の2以上のフレームに相当する一定周期ごとに、前記ハングオーバ長を制御することを特徴とする請求項1に記載の収音装置。
【請求項5】
前記ハングオーバ長制御手段は、前記一定周期の間に取得された前記目的エリア音判定値と前記非目的エリア音判定値について、平均値又は忘却係数を用いて重みづけ加算された値を用いて前記ハングオーバ長を制御することを特徴とする請求項4に記載の収音装置。
【請求項6】
コンピュータを、
複数のマイクロホンアレイの入力信号から目的エリアの方向に指向性を向けたビームフォーマ出力を取得し、それぞれの前記ビームフォーマ出力に基づいて前記目的エリアを音源とする目的エリア音を抽出する目的エリア音取得手段と、
前記目的エリア音に対する目的エリア音判定値を取得する目的エリア音判定値取得手段と、
前記目的エリア以外を音源とする非目的エリア音に対する非目的エリア音判定値を取得する非目的エリア音判定値取得手段と、
前記目的エリア音判定値と前記非目的エリア音判定値との比較結果に基づき、ハングオーバ長を制御するハングオーバ長制御手段と、
前記目的エリア音判定値に基づき、前記入力信号に所定の基準以上の前記目的エリア音の成分が含まれる目的エリア音区間であるか判定する目的エリア音区間判定処理を行い、前記目的エリア音区間判定処理で前記入力信号が目的エリア音区間であると判定された場合、その時点から前記ハングオーバ長制御手段が制御した前記ハングオーバ長の間は、前記目的エリア音区間判定処理の結果を目的エリア音区間であるという結果とする目的エリア音区間検出手段と、
直近に行われた前記目的エリア音区間判定処理で前記入力信号が目的エリア音区間であると判定されている間のみ前記目的エリア音を出力する出力手段と
して機能させることを特徴とする収音プログラム。
【請求項7】
収音装置が行う収音方法において、
前記収音装置は、目的エリア音取得手段、目的エリア音判定値取得手段、非目的エリア音判定値取得手段、ハングオーバ長制御手段、目的エリア音区間検出手段及び出力手段を有し、
前記目的エリア音取得手段は、複数のマイクロホンアレイの入力信号から目的エリアの方向に指向性を向けたビームフォーマ出力を取得し、それぞれの前記ビームフォーマ出力に基づいて前記目的エリアを音源とする目的エリア音を抽出し、
前記目的エリア音判定値取得手段は、前記目的エリア音に対する目的エリア音判定値を取得し、
前記非目的エリア音判定値取得手段は、前記目的エリア以外を音源とする非目的エリア音に対する非目的エリア音判定値を取得し、
前記ハングオーバ長制御手段は、前記目的エリア音判定値と前記非目的エリア音判定値との比較結果に基づき、ハングオーバ長を制御し、
前記目的エリア音区間検出手段は、前記目的エリア音判定値に基づき、前記入力信号に所定の基準以上の前記目的エリア音の成分が含まれる目的エリア音区間であるか判定する目的エリア音区間判定処理を行い、前記目的エリア音区間判定処理で前記入力信号が目的エリア音区間であると判定された場合、その時点から前記ハングオーバ長制御手段が制御した前記ハングオーバ長の間は、前記目的エリア音区間判定処理の結果を目的エリア音区間であるという結果とし、
前記出力手段は、直近に行われた前記目的エリア音区間判定処理で前記入力信号が目的エリア音区間であると判定されている間のみ前記目的エリア音を出力する
ことを特徴とする収音方法。
発明の詳細な説明
【技術分野】
【0001】
この発明は、収音装置、プログラム及び方法に関し、例えば、特定のエリアから発せられた音のみを強調し、それ以外のエリアの音を抑圧する収音装置に適用し得るものである。
続きを表示(約 2,100 文字)
【背景技術】
【0002】
雑音下での音声認識では、雑音の影響により音声認識の精度が下がるため、発話していない雑音区間を除外し、利用者の発話のみを切り出す音声区間検出には、高い精度が要求される。従来、音声区間検出を行う方式として、音声と雑音のパワー比に基づき区別する方式や、スペクトルの形状のような音声らしさに基づき区別する方式などが多数紹介されている。なお、音声と雑音のパワー比に基づき区別する方式は、無声子音のようなパワーの小さい音声であると抽出が難しくなるので、その対策として、一度音声が存在すると判定した場合、その後の数秒間は判定結果に関わらず、音声が存在すると判定する処理(ハングオーバ機能に対応する処理)で補う方法が良く使われる。
【0003】
しかしながら、これらの方式は、音声と雑音を区別できるが、目的とする音声(以下、「目的音」と呼ぶ)とそれ以外の不要な音声(以下、「妨害音」と呼ぶ)を区別することはできない。一方で、目的音と妨害音を区別して音声区間検出を行う方式として、入力信号の到来方位を意味するコヒーレンスを用いる方式も紹介されている。コヒーレンスは、右から到来する信号と左から到来する信号の相関なので、到来方向が左右のどちらかに大きく偏った場合か、偏りが無くても雑音のような明確な規則性の少ない信号の場合に小さくなる一方で、到来方向が正面の場合に大きくなる。このコヒーレンスを用いて入力信号の到来方向が正面か側方かを判断して、正面から到来する目的音と、側方から到来する妨害音を区別している。しかしながら、目的音と妨害音が同時に発話される(以下、「ダブルトーク」と呼ぶ)場合だと、妨害音が側方から到来するとコヒーレンスが小さくなるため、目的音区間中のハングオーバの効果が得られなくなり、逆に、妨害音が正面から到来するとコヒーレンスが大きくなるため、目的音区間が終了後もハングオーバ効果が働いてしまうという課題がある。
【0004】
これに対して、特許文献1では、妨害音が側方または正面から到来するときのコヒーレンスの動きに着目して、ハングオーバの長さ(以下、「ハングオーバ長」と呼ぶ)を制御する方法を提案している。具体的には、妨害音が側方から到来しているときは、コヒーレンスの大きさが頻繁に上下しているのに対して、妨害音が正面から到来しているときは、コヒーレンスの大きさがあまり上下しない。この点に着目して、妨害音が側方から到来していると判断したときは、ハングオーバ長を長くして音声が途切れないようにし、また、妨害音が正面から到来していると判断したときは、ハングオーバ長を短くして目的音の発話終了後に妨害音を誤って抽出しないようにしている。
【0005】
ところで、複数のマイクアレイのビームフォーマ出力に基づく目的方向信号を取得し、取得した目的方向信号をもう一方の目的方向信号からスペクトル減算処理することで非目的エリア音を抽出し、目的方向信号から非目的エリア音をスペクトル減算することで目的エリア音を抽出し、入力信号に目的エリア音が含まれるか否かによって、音声区間検出する方式として、特許文献2、特許文献3のような方式も提案されている。
【0006】
特許文献2では、背景雑音が強い環境下でエリアにある音を抽出する処理を行うと、ミュージカルノイズが残留してしまい、特に、エリアに音がない区間では、顕著に耳障りになるという課題を挙げている。それに対して、この特許では、入力信号に目的エリア音が含まれるか否かを、入力信号と目的エリア音のパワー比と閾値との関係から判定して、目的エリア音が無い場合は処理結果を出力しないことを、提案している。
【0007】
一方で、特許文献2では、背景雑音が強い環境でのミュージカルノイズへ対処できたが、SNRが悪いことに変わりはない。そのため、目的音が雑音に埋もれてしまい、特に無声子音のようにもともとパワーが小さく場合には検出できないという課題を挙げている。それに対して、特許文献3では、特許文献2で音が無いと判定された場合であっても、エリアの音を周波数成分ごともしくは周波数帯域ごとに再判定する方式を提案している。
【0008】
ここで、特許文献3の背景技術について記載する。複数の音源が存在する環境下において、ある特定方向の音のみ分離し収音する技術として、マイクロホンアレイを用いたビームフォーマ(Beam Former;以下「BF」とも呼ぶ)がある。BFとは、各マイクロホンに到達する音の時間差を利用して指向性を形成する技術である。従来、BFは、加算型と減算型の大きく2つの種類に分けられる。特に減算型BFは、加算型即に比べ、少ないマイクロホン数で指向性を形成できるという利点がある。
【0009】
図6は、マイクロホンMの数が2個の場合の減算型BF200に係る構成を示すブロック図である。
【0010】
図7は、2個のマイクロホンM1、M2を用いた減算型BF200により形成される指向性フィルタの例について示した説明図である。
(【0011】以降は省略されています)
この特許をJ-PlatPat(特許庁公式サイト)で参照する
関連特許
個人
店内配信予約システム
1か月前
サクサ株式会社
中継装置
1か月前
キヤノン株式会社
撮像装置
2か月前
キヤノン株式会社
撮像装置
6日前
日本精機株式会社
車両用表示装置
3か月前
キヤノン株式会社
電子機器
1か月前
キヤノン株式会社
通信装置
3か月前
株式会社リコー
画像形成装置
1日前
株式会社リコー
画像形成装置
25日前
ヤマハ株式会社
信号処理装置
2か月前
個人
補聴器のイヤピース耳穴挿入具
3か月前
日本精機株式会社
画像投映システム
1か月前
キヤノン電子株式会社
モバイル装置
1か月前
株式会社リコー
画像形成装置
5日前
電気興業株式会社
無線中継器
2か月前
ブラザー工業株式会社
読取装置
20日前
キヤノン株式会社
撮影システム
3か月前
キヤノン株式会社
画像表示装置
2か月前
リオン株式会社
電気機械変換器
3か月前
キヤノン株式会社
通信システム
2か月前
キヤノン株式会社
画像処理装置
3か月前
株式会社ヴィーネックス
カメラ
3か月前
株式会社ニコン
撮像装置
1か月前
株式会社クーネル
音響装置
3か月前
シャープ株式会社
表示装置
3か月前
エルメック株式会社
信号伝送回路
2か月前
パテントフレア株式会社
水中電波通信法
29日前
シャープ株式会社
電子機器
3か月前
キヤノン電子株式会社
シート材搬送装置
21日前
国立大学法人電気通信大学
小型光学装置
8日前
DXO株式会社
情報処理システム
1か月前
キヤノン電子株式会社
画像読取システム
2か月前
日本無線株式会社
無線通信システム
7日前
株式会社国際電気
無線通信システム
3か月前
株式会社オーディオテクニカ
受光器
1か月前
テックス通信株式会社
電話システム
1か月前
続きを見る
他の特許を見る