TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
公開番号
2025133264
公報種別
公開特許公報(A)
公開日
2025-09-11
出願番号
2024031096
出願日
2024-03-01
発明の名称
生成AIの調整用データのデータ構造、対話システム、調整方法及びプログラム
出願人
国立大学法人 鹿児島大学
代理人
個人
,
個人
,
個人
,
個人
主分類
G06F
40/44 20200101AFI20250904BHJP(計算;計数)
要約
【課題】大規模言語モデルによる対話システムを用いて、低資源言語による円滑な対話を実現する生成AIの調整用データのデータ構造、対話システム、調整方法及びプログラムを提供する。
【解決手段】対話システム1において、入出力部3の調整用データには、標準語である標準日本語で記述された第1会話文と、標準日本語と同族の言語に分類され、生成AIの学習用の言語資源が標準日本語より少ない低資源言語である鹿児島方言で記述され、第1会話文と意味が同じ第2会話文とを対比可能に含む対訳例文テキストデータ、標準日本語で用いられる第1単語と、鹿児島方言で用いられ第1単語と意味が同じ第2単語とを対比可能に含む語彙集テキストデータ及び標準日本語の文法と対比可能に鹿児島方言の文法が記述された文法テキストデータ10が含まれ、標準日本語による対話をサポートする大規模言語モデルを用いた生成AI2を調整する調整処理に用いられる。
【選択図】図1
特許請求の範囲
【請求項1】
標準語である第1言語で記述された第1会話文と、前記第1言語と同族の言語に分類され、生成AI(Generative Artificial Intelligence)の学習用の言語資源が前記第1言語より少ない低資源言語である第2言語で記述され、前記第1会話文と意味が同じ第2会話文とを対比可能に含む対訳例文テキストデータと、
前記第1言語で用いられる第1単語と、前記第2言語で用いられ前記第1単語と意味が同じ第2単語とを対比可能に含む語彙集テキストデータと、
前記第1言語の文法と対比可能に前記第2言語の文法が記述された文法テキストデータと、が含まれ、
前記第2言語で記述された文章を理解するととともに前記第2言語で記述された文章を作成可能に、前記第1言語による対話をサポートする大規模言語モデルを用いた生成AIを調整する調整処理に用いられる、
生成AIの調整用データのデータ構造。
続きを表示(約 1,300 文字)
【請求項2】
前記調整用データは、前記大規模言語モデルのファインチューニングに用いられる、
請求項1に記載の生成AIの調整用データのデータ構造。
【請求項3】
前記調整用データは、前記生成AIに付与するタスクとともにプロンプトに含まれる、
請求項1に記載の生成AIの調整用データのデータ構造。
【請求項4】
前記文法テキストデータには、
前記第1言語と前記第2言語との間の格、形容詞、動詞の活用、文末、接続詞の対応関係及び前記第2言語における文法の禁止事項が記述された文章が含まれる、
請求項1に記載の生成AIの調整用データのデータ構造。
【請求項5】
標準語である第1言語による対話をサポートする大規模言語モデルを用いた生成AIを備え、
前記生成AIは、
第1言語で記述された第1会話文と、前記第1言語と同族の言語に分類され、生成AIの学習用の言語資源が前記第1言語より少ない低資源言語である第2言語で記述され、前記第1会話文と意味が同じ第2会話文とを対比可能に含む対訳例文テキストデータと、
前記第1言語で用いられる第1単語と、前記第2言語で用いられ前記第1単語と意味が同じ第2単語とを対比可能に含む語彙集テキストデータと、
前記第1言語の文法と対比可能に前記第2言語の文法が記述された文法テキストデータと、が含まれる調整用データで調整される、
対話システム。
【請求項6】
標準語である第1言語による対話をサポートする大規模言語モデルを用いた生成AIの調整方法であって、
第1言語で記述された第1会話文と、前記第1言語と同族の言語に分類される方言であって、生成AIの学習用の言語資源が前記第1言語より少ない低資源言語である第2言語で記述され、前記第1会話文と意味が同じ第2会話文とを対比可能に含む対訳例文テキストデータと、
前記第1言語で用いられる第1単語と、前記第2言語で用いられ前記第1単語と意味が同じ第2単語とを対比可能に含む語彙集テキストデータと、
前記第1言語の文法と対比可能に前記第2言語の文法が記述された文法テキストデータと、が含まれる調整用データを前記生成AIに与え、前記第2言語で記述された文章を作成可能に、前記生成AIを調整する調整処理を実行させる、
調整方法。
【請求項7】
標準語である第1言語で記述された第1会話文と、前記第1言語と同族の言語に分類され、生成AIの学習用の言語資源が前記第1言語より少ない低資源言語である第2言語で記述され、前記第1会話文と意味が同じ第2会話文とを対比可能に含む対訳例文テキストデータと、
前記第1言語で用いられる第1単語と、前記第2言語で用いられ前記第1単語と意味が同じ第2単語とを対比可能に含む語彙集テキストデータと、
前記第1言語の文法と対比可能に前記第2言語の文法が記述された文法テキストデータと、が含まれる調整用データを用いて、前記第1言語による対話をサポートする大規模言語モデルを用いた生成AIを調整する調整処理を、
コンピュータに実行させるプログラム。
発明の詳細な説明
【技術分野】
【0001】
本発明は、生成AI(Generative Artificial Intelligence)の調整用データのデータ構造、対話システム、調整方法及びプログラムに関する。
続きを表示(約 1,900 文字)
【背景技術】
【0002】
ユーザとの対話によって文章等を生成する対話型の生成AIが用いられるようになっている。このような生成AIのベースは、大規模言語モデル(以下、LLM;Large Language Model)であり、生成AIによる生成物の完成度、すなわち精度はその学習に用いられる言語データのデータ量に依存する。そのため、生成AIは、データ量が比較的多い標準的な標準日本語で記述された文章を精度良く生成することはできても、データ量が少ない低資源言語で記述された文章の完成度は高くない。
【0003】
一方、低資源言語について、対訳辞書を網羅的に生成する研究が行われている(例えば、非特許文献1参照)。また、言語知識を利用して外国語と標準日本語との間の機械翻訳の精度を向上させる研究が行われている(例えば、非特許文献2参照)。
【先行技術文献】
【非特許文献】
【0004】
村上 陽平ら、“言語資源”、[online]、学校法人立命館大学 社会知能研究室、[令和6年2月16日検索]、インターネット <URL:https://www.si-lab.org/research_language-ja.html>
Zhuoyuan Mao、Raj Dabre、Fabien Cromieres、Haiyue Song、中尾 亮太、黒橋 禎夫、”ニューラル機械翻訳のための言語知識に基づくマルチタスク事前学習”言語処理学会 第26回年次大会、茨城、1061-1064、2020年3月
【発明の概要】
【発明が解決しようとする課題】
【0005】
このような低資源言語の典型例が方言であり、方言こそ、生成AIによる地域課題解決が期待される。かつて人々のコミュニケーションは、地域コミュニティに密接に結びついており、その地域住民同士で当該地域の方言を使って会話をすれば十分であった。しかし、近代以降、標準語の普及により、地域では若年層が当該方言を理解できなくなりつつある。また、地域間交流の活発化により、他地域の人との接触機会が増加している。この流れにより、現在社会においては、当該地域方言話者と非話者が接し、その際にミスコミュニケーションを生じる「方言の壁」が顕在化し、問題となっている。
【0006】
「方言の壁」問題は、医療現場において患者と医者との間の意思疎通を困難にするため、特に深刻であり、この点が地域の課題となっている。また、方言の中には消滅の危機を迎えているものもあり、その継承が地域の課題となっている。このような背景から、「方言の壁」を解消するツール又は消滅危機方言の継承支援教材の開発など、地域の課題を解決することが期待されている。
【0007】
本発明は、上記実情の下になされたものであり、大規模言語モデルによる対話システムを用いて、低資源言語による円滑な対話を実現することができる生成AIの調整用データのデータ構造、対話システム、調整方法及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0008】
上記目的を達成するために、本発明の第1の観点に係る生成AIの調整用データのデータ構造は、
標準語である第1言語で記述された第1会話文と、前記第1言語と同族の方言に分類され、生成AIの学習用の言語資源が前記第1言語より少ない低資源言語である第2言語で記述され、前記第1会話文と意味が同じ第2会話文とを対比可能に含む対訳例文テキストデータと、
前記第1言語で用いられる第1単語と、前記第2言語で用いられ前記第1単語と意味が同じ第2単語とを対比可能に含む語彙集テキストデータと、
前記第1言語の文法と対比可能に前記第2言語の文法が記述された文法テキストデータと、が含まれ、
前記第2言語で記述された文章を理解するととともに前記第2言語で記述された文章を作成可能に、前記第1言語による対話をサポートする大規模言語モデルを用いた生成AIを調整する調整処理に用いられる。
【0009】
前記調整用データは、前記大規模言語モデルのファインチューニングに用いられる、
こととしてもよい。
【0010】
前記調整用データは、前記生成AIに付与するタスクとともにプロンプトに含まれる、
こととしてもよい。
(【0011】以降は省略されています)
この特許をJ-PlatPat(特許庁公式サイト)で参照する
関連特許
個人
地球保全システム
3日前
個人
工程設計支援装置
1か月前
個人
フラワーコートA
1か月前
個人
冷凍食品輸出支援構造
1か月前
個人
為替ポイント伊達夢貯
1か月前
個人
表変換編集支援システム
23日前
個人
携帯情報端末装置
1か月前
個人
結婚相手紹介支援システム
1か月前
個人
知財出願支援AIシステム
1か月前
個人
AIによる情報の売買の仲介
1か月前
個人
パスワード管理支援システム
23日前
個人
行動時間管理システム
25日前
個人
システム及びプログラム
16日前
日本精機株式会社
施工管理システム
1か月前
個人
食品レシピ生成システム
2日前
株式会社キーエンス
受発注システム
2日前
個人
AIキャラクター制御システム
23日前
株式会社キーエンス
受発注システム
2日前
株式会社キーエンス
受発注システム
2日前
個人
海外支援型農作物活用システム
15日前
個人
アンケート支援システム
2か月前
個人
パスポートレス入出国システム
1か月前
株式会社アジラ
進入判定装置
1か月前
個人
冷凍加工連携型農場運用システム
1か月前
個人
音声対話型帳票生成支援システム
23日前
サクサ株式会社
中継装置
23日前
個人
SaaS型勤務調整支援システム
23日前
個人
社会還元・施設向け供給支援構造
23日前
個人
食事受注会計処理システム
1か月前
大阪瓦斯株式会社
住宅設備機器
1か月前
大同特殊鋼株式会社
疵判定方法
9日前
個人
未来型家系図構築システム
15日前
キヤノン株式会社
表示システム
2日前
個人
人格進化型対話応答制御システム
23日前
株式会社アジラ
移動方向推定装置
1か月前
株式会社竹中工務店
管理システム
15日前
続きを見る
他の特許を見る