TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
公開番号
2025113752
公報種別
公開特許公報(A)
公開日
2025-08-04
出願番号
2024008068
出願日
2024-01-23
発明の名称
発話情報抽出装置及びそのプログラム
出願人
株式会社ACES
代理人
弁理士法人IP-FOCUS
,
個人
主分類
G10L
17/00 20130101AFI20250728BHJP(楽器;音響)
要約
【課題】音声データから発話者の発話を抽出する際に、話者とマイクとの関係を明らかにして処理精度の向上を実現する発話情報抽出装置及びプログラムを提供する。
【解決手段】発話情報抽出装置1は、音声データ2を入手する音声データ入手手段3と、音声データ2において使用されたマイクの数と発話者の数を入手する情報入手手段4と、音声データ2を発話毎に分割して分割発話とする発話分割手段5と、分割発話と発話者とを紐付ける紐付け手段6と、発話者と紐付けられた紐付け結果を表示させる表示手段7と、を備える。マイクの数と発話者の数が同数であった場合、音声データ2のうち、各マイクで録音された分割発話を、単一の発話者と紐付ける処理を行う。
【選択図】図1
特許請求の範囲
【請求項1】
音声データから発話者の発話を抽出する発話情報抽出装置であって、
前記音声データを入手する音声データ入手手段と、
前記音声データにおいて使用されたマイクの数と前記発話者の数を入手する情報入手手段と、
前記音声データを発話毎に分割して分割発話とする発話分割手段と、
前記分割発話と前記発話者とを紐付ける紐付け手段と、
前記発話者と紐付けられた紐付け結果を表示させる表示手段とを備え、
前記紐付け手段は、前記マイクの数が前記発話者の数と同数であるときは、前記マイク毎の前記分割発話を単一の前記発話者に紐付けし、
前記マイクの数が前記発話者の数より少ないときは、前記分割発話毎に前記発話者との紐付けを行うことを特徴とする発話情報抽出装置。
続きを表示(約 850 文字)
【請求項2】
請求項1に記載の発話情報抽出装置であって、
前記表示手段は、
前記マイクの数が前記発話者の数と同数であるときは、前記マイク毎に紐付けられた発話者を表示し、
前記マイクに紐付けられた前記発話者が複数あるときは、主たる前記発話者を表示すると共に前記発話者が複数であることを示す複数表示を行い、前記複数表示の開示指示があったときは、前記マイクに紐付けられた複数の前記発話者のすべてを表示させることを特徴とする発話情報抽出装置。
【請求項3】
請求項1に記載の発話情報抽出装置であって、
前記紐付け手段は、複数の発話者の基準音声によって学習された発話者DBを参照し、
前記発話者DBの学習を行う発話者DB学習手段をさらに備え、
前記発話者DB学習手段は、ユーザが前記発話者の基準音声を構成するパラメータを管理画面によって編集可能であることを特徴とする発話情報抽出装置。
【請求項4】
請求項3に記載の発話情報抽出装置であって、
前記パラメータは、前記基準音声が録音されたイベントであることを特徴とする発話情報抽出装置。
【請求項5】
請求項3に記載の発話情報抽出装置であって、
前記発話者DBは、前記発話者の基準音声を解析した結果の発話の特徴量を含むことを特徴とする発話情報抽出装置。
【請求項6】
請求項1に記載の発話情報抽出装置であって、
前記紐付け手段の紐付け結果に対してユーザが修正可能な修正手段を備え、
前記発話者DB学習手段は、ユーザによって修正された修正結果を前記発話者DBが学習し、
前記紐付け手段は、学習済の前記発話者DBを参照して紐付けを行うことを特徴とする発話情報抽出装置。
【請求項7】
コンピュータを請求項1乃至6のいずれか1項に記載の発話情報抽出装置として作動させる発話情報抽出プログラム。
発明の詳細な説明
【技術分野】
【0001】
本発明は、オンラインミーティング、或いは講演会等の音声データについて、発話者を認識して発話を抽出する装置及びそのプログラムに関する。
続きを表示(約 1,700 文字)
【背景技術】
【0002】
オンラインミーティング、或いは講演会等の音声データについて、いつ誰が話したかを推定して抽出する技術は、話者ダイアライゼーション技術と呼ばれている。例えば、オンラインミーティングの音声データについて、発話者を認識してその発話を抽出することにより、事後的にそのオンラインミーティングにおける発話の有効性の分析等を行うことができる。
【0003】
特許文献1には、音声ファイルに対して行う話者ダイアライゼーション方法であって、話者の基準音声を利用して音声ファイルから基準音声の発話者を識別し、識別されなかった残りの発話区間に対してクラスタリングを利用して話者の識別を行う話者ダイアライゼーション方法が開示されている。
【0004】
特許文献1の方法では、音声ファイルを録音したマイク(マイクロフォン)についてどのように取り扱うかの記載がないため、単に音声ファイルを発話毎に切り分けて、切り分けられた発話がどの発話者の発話であるかを識別している。
【先行技術文献】
【特許文献】
【0005】
特開2022-109867号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
特許文献1の方法では、音声ファイルを録音したマイクが単数であるか複数であるかに関わらず同じ処理を行っているが、本願発明者等は、話者ダイアライゼーションを行う際に、話者とマイクとの関係が処理の精度に影響を与えていることを知見した。
【0007】
本発明は、音声データから発話者の発話を抽出する際に、話者とマイクとの関係を明らかにして処理精度の向上を実現する発話情報抽出装置及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0008】
上記目的を達成するために、本発明の発話情報抽出装置は、音声データから発話者の発話を抽出する発話情報抽出装置であって、前記音声データを入手する音声データ入手手段と、前記音声データにおいて使用されたマイクの数と前記発話者の数を入手する情報入手手段と、前記音声データを発話毎に分割して分割発話とする発話分割手段と、前記分割発話と前記発話者とを紐付ける紐付け手段と、前記発話者と紐付けられた紐付け結果を表示させる表示手段とを備え、前記紐付け手段は、前記マイクの数が前記発話者の数と同数であるときは、前記マイク毎の前記分割発話を単一の前記発話者に紐付けし、前記マイクの数が前記発話者の数より少ないときは、前記分割発話毎に前記発話者との紐付けを行うことを特徴とする。
【0009】
本発明の発話情報抽出装置は、情報入手手段によってマイクの数と発話者の数を入手し、マイクの数が発話者の数より少ないときは、各マイクによって録音がなされた音声データには複数の発話者の発話が含まれることになるので、分割発話毎に発話者との紐付けを行う。一方で、マイクの数が発話者の数と同数であるときは、各マイクによって録音がなされた音声データは、単独の発話者による発話のみとなるため、各マイクの音声データについて、一度どの発話者の発話かを判定できれば、その後は他の発話者か否かの判断をする必要がない。よって、マイクの数が発話者の数と同数であるときは不要な処理を行わないため誤った処理がなされることがなく、マイクの数が発話者の数より少ないときのみ紐付け処理を行えばよく、処理効率が向上すると共に処理精度が向上する。
【0010】
本発明の発話情報抽出装置において、前記表示手段は、前記マイクの数が前記発話者の数と同数であるときは、前記マイク毎に紐付けられた発話者を表示し、前記マイクに紐付けられた前記発話者が複数あるときは、主たる前記発話者を表示すると共に前記発話者が複数であることを示す複数表示を行い、前記複数表示の開示指示があったときは、前記マイクに紐付けられた複数の前記発話者のすべてを表示させるようにしてもよい。
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
株式会社ACES
発話情報抽出装置及びそのプログラム
2日前
三井化学株式会社
遮音構造体
1か月前
三井化学株式会社
吸音構造体
29日前
三井化学株式会社
遮音構造体
1か月前
個人
弦楽器用押弦補助具及び弦楽器
1か月前
三井化学株式会社
遮音構造体
1か月前
富士フイルム株式会社
消音器
5日前
林テレンプ株式会社
防音カバー
1か月前
積水化学工業株式会社
吸音構造体
1日前
ヤマハ株式会社
弦楽器用の支持装置
5日前
富士フイルム株式会社
消音器付き風路
5日前
株式会社総合車両製作所
吸音パネル
28日前
株式会社JVCケンウッド
車載装置
1か月前
株式会社レゾナック
吸音材及び車両部材
21日前
個人
電気自動車等の「接近音」における最適な「音の種類」
1か月前
株式会社第一興商
カラオケ装置
28日前
個人
電子管楽器
1か月前
株式会社第一興商
カラオケ装置
14日前
株式会社JVCケンウッド
情報処理装置及び情報処理方法
29日前
株式会社第一興商
カラオケ装置
29日前
ヤマハ株式会社
鍵盤装置
6日前
ヤマハ株式会社
連打判定装置および方法、プログラム
15日前
株式会社コルグ
電子楽器用アナログエフェクタ
27日前
有限会社舞システム企画
介護情報生成システム
5日前
シャープ株式会社
制御装置、電気機器、およびシステム
8日前
トヨタ自動車株式会社
制御装置
9日前
ヤマハ株式会社
発音制御装置
1か月前
トヨタ自動車株式会社
電気自動車
1か月前
AOBAENERGY株式会社
サービス提供機器
1か月前
トヨタ自動車株式会社
音響式遮音材の製造方法
1か月前
本田技研工業株式会社
音声認識方法および音声認識装置
7日前
井関農機株式会社
作業車の操縦者用騒音低減装置
28日前
ローランド株式会社
鍵盤装置および押鍵情報の検出方法
29日前
ローランド株式会社
鍵盤装置および押鍵情報の検出方法
29日前
日本電波工業株式会社
音声再生装置及び音声再生方法
28日前
ローランド株式会社
鍵盤装置および鍵の揺動の規制方法
29日前
続きを見る
他の特許を見る