TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
公開番号
2025079377
公報種別
公開特許公報(A)
公開日
2025-05-22
出願番号
2023191954
出願日
2023-11-10
発明の名称
音声処理装置、音声処理方法、プログラム及び記憶媒体
出願人
パイオニア株式会社
代理人
個人
主分類
G10L
15/20 20060101AFI20250515BHJP(楽器;音響)
要約
【課題】音声認識の認識精度を向上させることが可能な音声処理装置等を提供する。
【解決手段】音声処理装置は、推定部と、設定部と、を有する。推定部は、マイクに入力されたマイク音声に含まれるシステム音声に対応する成分をエコー成分として推定する。設定部は、エコー成分の推定に係るステップサイズを、マイク音声及びエコー成分の相関性に応じて異なるサイズに設定する。
【選択図】図3
特許請求の範囲
【請求項1】
マイクに入力されたマイク音声に含まれるシステム音声に対応する成分をエコー成分として推定する推定部と、
前記エコー成分の推定に係るステップサイズを、前記マイク音声及び前記エコー成分の相関性に応じて異なるサイズに設定する設定部と、
を有する音声処理装置。
続きを表示(約 1,000 文字)
【請求項2】
前記設定部は、前記マイク音声及び前記エコー成分の相関性が高い場合に、前記ステップサイズを相対的に大きい第1のサイズに設定し、前記マイク音声及び前記エコー成分の相関性が低い場合に、前記ステップサイズを相対的に小さい第2のサイズに設定する請求項1に記載の音声処理装置。
【請求項3】
前記マイク音声及び前記エコー成分の相関性を示す相関係数を算出する算出部をさらに有し、
前記設定部は、前記相関係数が所定の閾値よりも大きい場合に、前記ステップサイズを前記第1のサイズに設定し、前記相関係数が前記所定の閾値以下である場合に、前記ステップサイズを前記第2のサイズに設定する請求項2に記載の音声処理装置。
【請求項4】
前記マイク音声から前記エコー成分を差し引くことにより、前記マイク音声に含まれる前記システム音声を抑制する抑制部と、
前記抑制された前記システム音声を含む前記マイク音声を減衰させる減衰部と、をさらに有する請求項1に記載の音声処理装置。
【請求項5】
前記設定部は、前記ステップサイズとして、前記エコー成分の推定に用いられるフィルタにおけるフィルタ係数の可変幅を設定する請求項1に記載の音声処理装置。
【請求項6】
前記設定部は、前記エコー成分の推定に係るステップサイズを、複数のステップサイズのうちの一のステップサイズに設定する請求項1に記載の音声処理装置。
【請求項7】
コンピュータが実行する音声処理方法であって、
マイクに入力されたマイク音声に含まれるシステム音声に対応する成分をエコー成分として推定する推定工程と、
前記エコー成分の推定に係るステップサイズを、前記マイク音声及び前記エコー成分の相関性に応じて異なるサイズに設定する設定工程と、
を有する音声処理方法。
【請求項8】
コンピュータにより実行されるプログラムであって、
マイクに入力されたマイク音声に含まれるシステム音声に対応する成分をエコー成分として推定する推定部、及び、
前記エコー成分の推定に係るステップサイズを、前記マイク音声及び前記エコー成分の相関性に応じて異なるサイズに設定する設定部として前記コンピュータを機能させるプログラム。
【請求項9】
請求項8に記載のプログラムを記憶した記憶媒体。
発明の詳細な説明
【技術分野】
【0001】
本開示は、音声を処理する技術に関する。
続きを表示(約 1,100 文字)
【背景技術】
【0002】
音声に含まれるエコー成分を除去するエコーキャンセルに係る技術が従来知られている。
【0003】
具体的には、例えば、特許文献1には、マイクに入力されたユーザの発話音声と、当該マイクに入力されたエコーと、を含む音声から当該エコーに相当する成分を除去する技術が開示されている。
【先行技術文献】
【特許文献】
【0004】
特開2009-109536号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
例えば、スマートスピーカ等のような、音声認識を利用した対話型の装置に入力された音声に対してエコーキャンセルを適用した場合には、音声の劣化により音声認識の認識精度が低下してしまう、という問題点が生じる。
【0006】
これに対し、特許文献1には、前述の問題点を解消するための方法について特に開示等されていない。そのため、特許文献1に開示された技術によれば、前述の問題点に応じた課題が生じている。
【0007】
本開示は、上記の課題を鑑み、音声認識の認識精度を向上させることが可能な音声処理装置を提供することを主な目的とする。
【課題を解決するための手段】
【0008】
請求項に記載の発明は、音声処理装置であって、マイクに入力されたマイク音声に含まれるシステム音声に対応する成分をエコー成分として推定する推定部と、前記エコー成分の推定に係るステップサイズを、前記マイク音声及び前記エコー成分の相関性に応じて異なるサイズに設定する設定部と、を有する。
【0009】
請求項に記載の発明は、コンピュータが実行する音声処理方法であって、マイクに入力されたマイク音声に含まれるシステム音声に対応する成分をエコー成分として推定する推定工程と、前記エコー成分の推定に係るステップサイズを、前記マイク音声及び前記エコー成分の相関性に応じて異なるサイズに設定する設定工程と、を有する。
【0010】
請求項に記載の発明は、コンピュータにより実行されるプログラムであって、マイクに入力されたマイク音声に含まれるシステム音声に対応する成分をエコー成分として推定する推定部、及び、前記エコー成分の推定に係るステップサイズを、前記マイク音声及び前記エコー成分の相関性に応じて異なるサイズに設定する設定部として前記コンピュータを機能させる。
【図面の簡単な説明】
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
パイオニア株式会社
情報処理装置、情報収集装置、地図情報更新タイミング判定システム、地図情報更新タイミング判定方法およびプログラム
4日前
個人
メガホン
15日前
個人
リアルタイム翻訳システム
1か月前
個人
10デジタルサラウンドラジオ
1か月前
個人
グランドピアノの鍵盤支持構造
1日前
個人
音鳴らし具
5日前
合同会社Bootstrap
弦楽器
12日前
三井化学株式会社
遮音構造体
20日前
三井化学株式会社
遮音構造体
1か月前
個人
補助譜面台及び補助譜面台セット
4日前
三菱電機株式会社
吸音体
14日前
株式会社イノアックコーポレーション
防音材
6日前
旭化成株式会社
内装吸音材
15日前
ヤマハ株式会社
情報処理方法
13日前
ヤマハ株式会社
情報処理方法
13日前
矢崎総業株式会社
車両用対話システム
26日前
矢崎総業株式会社
車両用対話システム
26日前
矢崎総業株式会社
車両用対話システム
26日前
矢崎総業株式会社
車両用対話システム
26日前
矢崎総業株式会社
車両用対話システム
26日前
矢崎総業株式会社
車両用対話システム
26日前
トヨタ自動車株式会社
音声出力装置
1日前
トヨタ自動車株式会社
音声制御装置
1か月前
トヨタ自動車株式会社
情報処理装置
1か月前
株式会社第一興商
カラオケ装置
22日前
ヤマハ株式会社
鍵盤楽器
1か月前
ヤマハ株式会社
管楽器用部品及び管楽器
今日
トヨタ自動車株式会社
車両
14日前
ヤマハ株式会社
鍵盤装置
21日前
株式会社しくみ
音声翻訳プログラム
1か月前
株式会社Gottsu
サキソフォーン向けねじ込み式スクリュー
1か月前
学校法人 工学院大学
音響拡散パネル
21日前
日本放送協会
音声認識装置およびプログラム
26日前
国立研究開発法人産業技術総合研究所
実況音声生成システム
18日前
ソフトバンクグループ株式会社
システム
1か月前
株式会社SCALER
カラオケ管理システム
1か月前
続きを見る
他の特許を見る