TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025160510
公報種別
公開特許公報(A)
公開日
2025-10-22
出願番号
2025134205,2024097168
出願日
2025-08-12,2018-09-11
発明の名称
連続発話推定方法、連続発話推定装置、およびプログラム
出願人
NTT株式会社
代理人
個人
,
個人
,
個人
主分類
G10L
15/28 20130101AFI20251015BHJP(楽器;音響)
要約
【課題】利用方法に合わせて適切に動作を変化させる。
【解決手段】本開示の連続発話推定方法は、利用者の音声にキーワードが含まれるか否かを検出する。利用者の音声に含まれるキーワードの後に連続する発話がある場合は応答音を発出せず、利用者の音声に含まれるキーワードの後に連続する発話がない場合は応答音を発出するよう、応答音の発出を制御する。利用者の音声に含まれるキーワードの後に連続する発話がない場合は、応答音の発出終了後の目的音を音声認識の対象とする。
【選択図】図8
特許請求の範囲
【請求項1】
利用者の音声にキーワードが含まれるか否かを検出し、
上記キーワードの後に連続する発話がある場合は応答音を発出せず、上記キーワードの後に連続する発話がない場合は上記応答音を発出するよう、上記応答音の発出を制御し、
上記キーワードの後に連続する発話がない場合は、上記応答音の発出終了後の目的音を音声認識の対象とする、
連続発話推定方法。
続きを表示(約 650 文字)
【請求項2】
上記キーワードの後に連続する発話がない場合は、上記キーワード検出時点から上記応答音の長さ分だけ時間が経過した時点から、上記目的音として抽出する、請求項1記載の連続発話推定方法。
【請求項3】
上記キーワードの後に連続する発話がある場合、上記キーワードの発話直後から上記目的音として抽出する、請求項2記載の連続発話推定方法。
【請求項4】
利用者の音声にキーワードが含まれるか否かを検出し、かつ上記キーワードの後に連続する発話があるか否かを検出する連続発話検出付キーワード検出部と、
上記キーワードの後に連続する発話がある場合は応答音を発出せず、上記キーワードの後に連続する発話がない場合は上記応答音を発出するよう、上記応答音の発出を制御する、制御部と、
上記キーワードの後に連続する発話がない場合は、上記応答音の発出終了後の目的音を音声認識の対象とする目的音出力部と、
を含む連続発話推定装置。
【請求項5】
コンピュータに、
利用者の音声にキーワードが含まれるか否かを検出し、
上記キーワードの後に連続する発話がある場合は応答音を発出せず、上記キーワードの後に連続する発話がない場合は上記応答音を発出するよう、上記応答音の発出を制御し、
上記キーワードの後に連続する発話がない場合は、上記応答音の発出終了後の目的音を音声認識の対象とする、
処理を実行させるためのプログラム。
発明の詳細な説明
【技術分野】
【0001】
この発明は、キーワードの発音後に連続して目的音の発話があるか否かを推定する技術に関する。
続きを表示(約 2,000 文字)
【背景技術】
【0002】
例えばスマートスピーカや車載システムなどの、音声による制御が可能な機器では、トリガとなるキーワードが発音された際に音声認識を開始するキーワードウェイクアップと呼ばれる機能が搭載されていることがある。このような機能では、音声信号を入力とし、キーワードの発音を検出する技術が必要となる。
【0003】
図1は、非特許文献1に開示されている従来技術の構成である。従来技術では、キーワード検出部91が入力された音声信号からキーワードの発音を検出すると、目的音出力部99がスイッチをオンにして、当該音声信号を音声認識等の対象とする目的音として出力する。また、応答音出力部92がキーワード検出時に応答音を出力して、キーワードの発音を検出したことを利用者に知らせる。このとき、各処理のタイミングを制御するために、遅延部93をさらに備え、キーワード検出部91の出力(図1A参照)または入力音声(図1B参照)を遅延させてもよい。
【先行技術文献】
【非特許文献】
【0004】
Sensory,Inc.、“TrulyHandsfreeTM”、[online]、[平成30年8月17日検索]、インターネット<URL: http://www.sensory.co.jp/product/thf.htm>
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、従来技術では、キーワードを発話した後に応答音を待ってから目的音を発話する利用方法の他に、キーワードと目的音を連続して発話する利用方法もあり得る。応答音を待ってから目的音を発話する利用方法を想定して、応答音の後に目的音区間の開始位置を設定した場合、利用者がキーワードと目的音を連続して発話すると目的音の話頭が切れてしまうという問題が生じる。また、キーワードと目的音を連続して発話する利用方法を想定して、キーワード発話の直後に目的音区間の開始位置を設定した場合、応答音が目的音の発話と時間的に重なり音声認識しにくい音になってしまうという問題がある。
【0006】
この発明の目的は、上述のような技術的課題を鑑みて、キーワードを発話した後で応答音を待ってから目的音を発話する利用方法と、キーワードと目的音を連続して発話する利用方法とを自動的に判別し、各利用方法に合わせて適切に動作を変化させることである。
【課題を解決するための手段】
【0007】
上記の課題を解決するために、この発明の一の態様の連続発話推定方法は、利用者の音声にキーワードが含まれるか否かを検出し、キーワードの後に連続する発話がある場合は応答音を発出せず、キーワードの後に連続する発話がない場合は応答音を発出するよう、応答音の発出を制御し、キーワードの後に連続する発話がない場合は、応答音の発出終了後の目的音を音声認識の対象とする。
【発明の効果】
【0008】
この発明によれば、キーワードを発話した後で応答音を待ってから目的音を発話する利
用方法と、キーワードと目的音を連続して発話する利用方法とを自動的に判別できるため、各利用方法に合わせて適切に動作を変化させることができる。
【図面の簡単な説明】
【0009】
図1は従来のキーワード検出装置の機能構成を例示する図である。
図2は発明の原理を説明するための図である。
図3は第一実施形態の連続発話推定装置の機能構成を例示する図である。
図4は第一実施形態の連続発話推定方法の処理手順を例示する図である。
図5は第二実施形態の連続発話推定装置の機能構成を例示する図である。
図6は第三実施形態の連続発話推定装置の機能構成を例示する図である。
図7は第四実施形態の連続発話推定装置の機能構成を例示する図である。
図8は第五実施形態の連続発話推定装置の機能構成を例示する図である。
図9は第六実施形態の連続発話推定装置の機能構成を例示する図である。
【発明を実施するための形態】
【0010】
従来技術では、キーワードを発話した後で応答音を待ってから目的音を発話する利用方法と、キーワードと目的音を連続して発話する利用方法との両方に対応することは難しかった。キーワードを発話した後で応答音を待ってから目的音を発話する利用方法を想定してキーワード検出時に応答音を発出すると、利用者がキーワードと目的音を連続して発話する利用方法を想定して発話した場合に、応答音と目的音が重なってしまうということが主な問題点である。
(【0011】以降は省略されています)
この特許をJ-PlatPat(特許庁公式サイト)で参照する
関連特許
NTT株式会社
計算装置
9日前
NTT株式会社
評価装置、評価方法およびプログラム
5日前
NTT株式会社
推定装置、復元装置、推定方法、およびプログラム
16日前
NTT株式会社
連続発話推定方法、連続発話推定装置、およびプログラム
4日前
NTT株式会社
文生成装置、文生成学習装置、文生成方法、文生成学習方法及びプログラム
11日前
個人
木管楽器
19日前
個人
管楽器用リガチャ-
5日前
本田技研工業株式会社
車室環境制御装置
23日前
株式会社東芝
吸音装置
25日前
積水樹脂株式会社
吸音シート
23日前
株式会社SinasSP
自動騒音低減装置
10日前
株式会社第一興商
カラオケ装置
17日前
トヨタ自動車株式会社
判定装置
12日前
株式会社第一興商
カラオケ装置
23日前
カシオ計算機株式会社
発音装置、発音方法及びプログラム
12日前
日本軽金属株式会社
遮音壁
17日前
日本電気株式会社
放送用システムおよび字幕作成方法
19日前
シャープ株式会社
電子機器および電子機器の制御方法
17日前
ブラザー工業株式会社
カラオケ装置及びカラオケプログラム
17日前
カシオ計算機株式会社
電子鍵盤楽器
23日前
ブラザー工業株式会社
カラオケ用プログラム、及び、カラオケ装置
16日前
ブラザー工業株式会社
音声録音装置、及び、音声録音用プログラム
16日前
株式会社JVCケンウッド
収音装置、収音方法、およびプログラム
12日前
大建工業株式会社
吸音体及び音環境調整構造
12日前
有限会社ツバサ
エレキギターおよび保護フィルム付きの樹脂プレート
10日前
カシオ計算機株式会社
電子楽器、電子楽器の制御方法及びプログラム
23日前
トヨタ自動車株式会社
運転者認知機能改善システム
23日前
株式会社河合楽器製作所
鍵盤楽器の鍵盤装置
18日前
株式会社河合楽器製作所
鍵盤楽器の鍵盤装置
18日前
株式会社SUBARU
乗物用遮音構造体、及び車両
9日前
株式会社リコー
対話装置、対話システム、対話方法及びプログラム
16日前
株式会社NTTドコモ
情報処理装置及び情報処理方法
17日前
株式会社河合楽器製作所
鍵盤楽器の楽音制御方法
18日前
株式会社河合楽器製作所
鍵盤楽器の楽音制御装置
18日前
株式会社河合楽器製作所
鍵盤楽器の楽音制御方法
18日前
カシオ計算機株式会社
演奏装置、方法およびプログラム
24日前
続きを見る
他の特許を見る