TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025074056
公報種別公開特許公報(A)
公開日2025-05-13
出願番号2024187994
出願日2024-10-25
発明の名称発話言語モデルの訓練および適用の技術
出願人カナリー・スピーチ,インコーポレーテッド,国立研究開発法人国立循環器病研究センター,SMK株式会社
代理人個人,個人,個人
主分類G10L 15/10 20060101AFI20250502BHJP(楽器;音響)
要約【課題】発話言語モデルの訓練および適用の技術のための装置、システム、方法、およびコンピュータプログラム製品が開示される。
【解決手段】装置は、プロセッサと、プロセッサに結合されたメモリとを含む。メモリは、第1の言語で第1の発話モデルを訓練することであって、第1の発話モデルが、MCIを示す発話データの1つまたは複数の特性を判定するために使用される、訓練することと、第1の言語で訓練された第1の発話モデルの少なくとも一部を使用して、第2の言語で使用するために第2の発話モデルを訓練することと、第2の言語で使用するために訓練された第2の発話モデルを第2の言語で取り込まれたユーザの発話データに適用することと、第2の言語で使用するために訓練された第2の発話モデルからの出力に基づいて、ユーザについてのMCIの査定を判定することとを行うための、プロセッサによって実行可能なコードを記憶する。
【選択図】図12
特許請求の範囲【請求項1】
プロセッサと、
前記プロセッサに結合され、前記装置に、
第1の言語で第1の発話モデルを訓練することであって、前記第1の発話モデルが、軽度認知障害(MCI)を示す発話データの1つまたは複数の特性を判定するために使用される、訓練することと、
前記第1の言語で訓練された前記第1の発話モデルの少なくとも一部を使用して、第2の言語で使用するために第2の発話モデルを訓練することと、
前記第2の言語で使用するために訓練された前記第2の発話モデルを前記第2の言語で取り込まれたユーザの発話データに適用することと、
前記第2の言語で使用するために訓練された前記第2の発話モデルからの出力に基づいて、前記ユーザについてのMCIの査定を判定することと、
を行わせるための、前記プロセッサによって実行可能であるコードを記憶するメモリと、
を備える、装置。
続きを表示(約 750 文字)【請求項2】
前記第1の言語で訓練された前記第1の発話モデルが、前記発話データの部分言語特性を分析するように構成される、請求項1に記載の装置。
【請求項3】
前記部分言語特性が、発話トーン、発話速度、発話パターン、音響発話特性、韻律発話特性、および言語学的発話特徴のうちの少なくとも1つを含む、請求項2に記載の装置。
【請求項4】
前記第1の言語で訓練された前記第1の発話モデルが、非発話データを分析するためにさらに訓練され、前記ユーザの非発話データが、前記ユーザについてのMCIの前記査定を判定するために前記第1の言語で訓練された前記第1の発話モデルにさらに提供される、請求項1に記載の装置。
【請求項5】
前記非発話データが、前記ユーザについての人口統計情報を含む、請求項4に記載の装置。
【請求項6】
前記非発話データが、歩容データを含み、前記歩容データが、前記ユーザの歩き方を記述する、請求項4に記載の装置。
【請求項7】
前記非発話データが、アクティビティデータを含み、前記アクティビティデータが、前記ユーザに関連付けられた1つまたは複数のセンサから取り込まれる、請求項4に記載の装置。
【請求項8】
前記非発話データが、前記ユーザの運転履歴に関連する運転関連データを含む、請求項4に記載の装置。
【請求項9】
前記非発話データが、前記ユーザについての投薬情報を含む、請求項4に記載の装置。
【請求項10】
前記非発話データが、前記ユーザについての1つまたは複数の運動機能を記述するデータを含む、請求項4に記載の装置。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
[0001]本発明は、音声分析に関し、より詳細には、収集された音声サンプルに基づく1つまたは複数の病状の自動査定および診断に関する。
続きを表示(約 3,100 文字)【背景技術】
【0002】
[0002]神経損傷および疾患ならびに他の病状の査定は、医療従事者によって手動で行われることが多く、鉛筆と紙で手書きされたフォームに基づき得る。しかしながら、手動による査定は不正確であり、および/または一貫性がないことがある。
【先行技術文献】
【特許文献】
【0003】
米国特許第10152988号明細書
米国特許第10311980号明細書
米国特許出願公開第2023/072242号明細書
【発明の概要】
【課題を解決するための手段】
【0004】
[0003]発話言語モデルの訓練および適用の技術のための装置が提示される。一実施形態では、装置は、プロセッサと、プロセッサに結合されたメモリとを含む。一実施形態では、メモリは、第1の言語で第1の発話モデルを訓練することであって、第1の発話モデルが、MCIを示す発話データの1つまたは複数の特性を判定するために使用される、訓練することと、第1の言語で訓練された第1の発話モデルの少なくとも一部を使用して、第2の言語で使用するために第2の発話モデルを訓練することと、第2の言語で使用するために訓練された第2の発話モデルを第2の言語で取り込まれたユーザの発話データに適用することと、第2の言語で使用するために訓練された第2の発話モデルからの出力に基づいて、ユーザについてのMCIの査定を判定することとをするための、プロセッサによって実行可能なコードを記憶する。
【0005】
[0004]別の実施形態では、装置は、第1の言語で第1の発話モデルを訓練する手段であって、第1の発話モデルが、MCIを示す発話データの1つまたは複数の特性を判定するために使用される、訓練する手段を含む。ある実施形態では、装置は、第1の言語で訓練された第1の発話モデルの少なくとも一部を使用して、第2の言語で使用するために第2の発話モデルを訓練する手段を含む。いくつかの実施形態では、装置は、第2の言語で使用するために訓練された第2の発話モデルを第2の言語で取り込まれたユーザの発話データに適用する手段を含む。一実施形態では、装置は、第2の言語で使用するために訓練された第2の発話モデルからの出力に基づいて、ユーザについてのMCIの査定を判定する手段を含む。
【0006】
[0005]発話言語モデルの訓練および適用の技術のための方法が提示される。一実施形態において、方法は、第1の言語で第1の発話モデルを訓練するステップであって、第1の発話モデルが、MCIを示す発話データの1つまたは複数の特性を判定するために使用される、訓練するステップと、第1の言語で訓練された第1の発話モデルの少なくとも一部を使用して、第2の言語で使用するために第2の発話モデルを訓練するステップと、第2の言語で使用するために訓練された第2の発話モデルを第2の言語で取り込まれたユーザの発話データに適用するステップと、第2の言語で使用するために訓練された第2の発話モデルからの出力に基づいて、ユーザについてのMCIの査定を判定するステップとを含む。
【0007】
[0006]コンピュータ可読記憶媒体を含むコンピュータプログラム製品が提示される。ある実施形態では、コンピュータ可読記憶媒体は、発話言語モデルの訓練および適用の技術のための動作を実行するように実行可能な、コンピュータ使用可能プログラムコードを記憶する。いくつかの実施形態では、動作の1つまたは複数は、開示された装置、システム、および/または方法に関して上述した1つまたは複数のステップに実質的に類似であってもよい。
【0008】
[0007]発明の利点が容易に理解されるために、簡潔に上述した発明のより詳細な説明が、添付図面において例示される特定の実施形態に対する参照によって表される。これらの図面が、単に発明の典型的な実施形態のみを示し、したがって、その範囲を限定するものと考えられるべきではないと理解すると、発明は、添付図面の使用を通して、追加の特殊性および詳細とともに記載され説明される。
【図面の簡単な説明】
【0009】
[0008]発話言語モデルの訓練および適用の技術のためのシステムの一実施形態を示す概略ブロック図である。
[0009]発話言語モデルの訓練および適用の技術のためのシステムのさらなる実施形態を示す概略ブロック図である。
[0010]医療診断を行うために数学モデルを用いて発話データを処理するためのシステムの一実施形態を示す概略ブロック図である。
[0011]発話データの訓練コーパスの一実施形態を示す概略ブロック図である。
[0012]病状を診断する際に使用するためのプロンプトのリストの一実施形態を示す概略ブロック図である。
[0013]病状を診断するための数学モデルを訓練するための特徴を選択するシステムの一実施形態を示す概略ブロック図である。
[0014]特徴値および診断値のペアのグラフの一実施形態を示す概略ブロック図である。
[0015]特徴値および診断値のペアのグラフのさらなる実施形態を示す概略ブロック図である。
[0016]病状を診断するための数学モデルを訓練するために特徴を選択する方法の一実施形態を示す概略フローチャート図である。
[0017]病状を診断するための数学モデルとともに使用するためのプロンプトを選択する方法の一実施形態を示す概略フローチャート図である。
[0018]選択されたプロンプトのセットに適合される、病状を診断するための数学モデルを訓練する方法の一実施形態を示す概略フローチャート図である。
[0019]病状を診断するための数学モデルを訓練および展開するために使用され得るコンピューティングデバイスの一実施形態を示す概略ブロック図である。
[0020]診断装置の一実施形態を示す概略ブロック図である。
[0021]発話言語モデルの訓練および適用の技術のための方法の一実施形態を示す概略フローチャート図である。
[0022]発話言語モデルの訓練および適用の技術のための方法のさらなる実施形態を示す概略フローチャート図である。
【発明を実施するための形態】
【0010】
[0001]概して、本明細書の主題は、訓練済み機械学習モデルを使用する発話または音声データ分析に基づいて、軽度認知障害(MCI)を有するユーザのリスクまたは尤度を査定することを目的とする。本明細書で使用されるとき、MCIは、前駆期の間、例えば、正常老化による予想される低下と認知症によるより深刻な低下との間の、小さいが測定可能な程度の認知機能低下を指す。MCIは通常、日常会話または観察によって検出することができず、MCIを有する人々の大半が、自分が認知の問題を有することに気づいていないと推定される。MCIを有する人々は、最近の会話やイベントを覚えておくこと、スケジュールおよび約束を把握しておくこと、またはタスクについての新たなガイドラインを使用することに苦労する。正常老化とMCIとを区別することは、最も注意深い一次診療医にとってでさえ難しいタスクであり、それを行うことは、適時の介入および最適な治療結果のためには重要である。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

個人
リアルタイム翻訳システム
26日前
個人
10デジタルサラウンドラジオ
11日前
三井化学株式会社
遮音構造体
20日前
矢崎総業株式会社
車両用対話システム
5日前
矢崎総業株式会社
車両用対話システム
5日前
矢崎総業株式会社
車両用対話システム
5日前
矢崎総業株式会社
車両用対話システム
5日前
矢崎総業株式会社
車両用対話システム
5日前
トヨタ自動車株式会社
音声制御装置
19日前
矢崎総業株式会社
車両用対話システム
5日前
株式会社第一興商
カラオケ装置
1日前
トヨタ自動車株式会社
情報処理装置
26日前
ヤマハ株式会社
鍵盤装置
今日
ヤマハ株式会社
鍵盤楽器
19日前
株式会社しくみ
音声翻訳プログラム
21日前
日本放送協会
音声認識装置およびプログラム
5日前
学校法人 工学院大学
音響拡散パネル
今日
株式会社Gottsu
サキソフォーン向けねじ込み式スクリュー
13日前
ソフトバンクグループ株式会社
システム
27日前
ソフトバンクグループ株式会社
システム
27日前
株式会社SCALER
カラオケ管理システム
28日前
株式会社エクシング
携帯端末用プログラム、及び、カラオケシステム
5日前
株式会社田中
防音材を充填した金属パイプ
26日前
カシオ計算機株式会社
電子楽器、方法およびプログラム
13日前
日本音響エンジニアリング株式会社
放射音制御構造体及びその設計支援方法
29日前
アルプスアルパイン株式会社
音場制御システム及び音場制御方法
今日
カシオ計算機株式会社
プログラム、方法および情報処理装置
27日前
カシオ計算機株式会社
プログラム、方法および情報処理装置
27日前
カシオ計算機株式会社
楽音処理装置、方法およびプログラム
13日前
日本放送協会
演奏箇所追跡装置及びそのプログラム
11日前
個人
レッスン楽譜、レッスン楽譜の表示方法、レッスン方法およびプログラム
4日前
ビーサイズ株式会社
情報処理装置、情報処理端末、情報処理方法、情報処理プログラム
11日前
Fusion Cubic株式会社
コールセンタ用プログラム及びコールセンタ用装置
27日前
株式会社コルグ
模倣音信号生成装置、電子楽器、非線形システム同定方法
4日前
カシオ計算機株式会社
センサ装置、電子機器、および電子楽器
19日前
パイオニア株式会社
案内装置
1か月前
続きを見る