TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
公開番号
2025115561
公報種別
公開特許公報(A)
公開日
2025-08-07
出願番号
2024010072
出願日
2024-01-26
発明の名称
言語モデル利用システムおよび言語モデル利用方法
出願人
株式会社野村総合研究所
代理人
個人
主分類
G06F
16/903 20190101AFI20250731BHJP(計算;計数)
要約
【課題】蓄積されているLLMの外部の知見の中に機密情報等が含まれている場合であっても適切にプロンプトエンジニアリングを行うことを可能とする。
【解決手段】言語モデル4に利用者5から指定されたプロンプト6の文章を入力して、言語モデル4から得られた回答7を利用者5に対して出力する言語モデル利用システム1であって、知見に係る情報を蓄積した知見保持部3を有し、プロンプト6に基づいて、知見保持部3からプロンプト6に関連もしくは類似する知見を取得し、当該知見とプロンプト6とを合わせて言語モデル4に入力して回答7を得る。
【選択図】図1
特許請求の範囲
【請求項1】
言語モデルに利用者から指定されたプロンプトの文章を入力して、前記言語モデルから得られた回答を前記利用者に対して出力する言語モデル利用システムであって、
知見に係る情報を蓄積した知見保持部を有し、
前記プロンプトに基づいて、前記知見保持部から前記プロンプトに関連もしくは類似する知見を取得し、当該知見と前記プロンプトとを合わせて前記言語モデルに入力して回答を得る、言語モデル利用システム。
続きを表示(約 1,100 文字)
【請求項2】
請求項1に記載の言語モデル利用システムにおいて、
前記プロンプトと、前記利用者の属性情報に基づいて、前記知見保持部から前記プロンプトに関連もしくは類似する知見を取得する、言語モデル利用システム。
【請求項3】
請求項2に記載の言語モデル利用システムにおいて、
前記属性情報は、前記利用者の興味対象のジャンルの情報を含み、
前記知見保持部から前記プロンプトに関連もしくは類似する知見を取得する際に、前記ジャンルに合致する知見を取得する、言語モデル利用システム。
【請求項4】
請求項2に記載の言語モデル利用システムにおいて、
前記属性情報は、前記利用者の権限に係る情報を含み、
前記知見保持部から前記プロンプトに関連もしくは類似する知見を取得する際に、前記権限に基づいてアクセス可能な範囲から知見を取得する、言語モデル利用システム。
【請求項5】
請求項2に記載の言語モデル利用システムにおいて、
他の情報発信元から定期もしくは不定期に知見を収集して、前記知見保持部に蓄積する、言語モデル利用システム。
【請求項6】
請求項5に記載の言語モデル利用システムにおいて、
前記情報発信元から収集した知見を、当該知見を収集した時間の情報と合わせて履歴として前記知見保持部に蓄積し、
前記知見保持部から前記プロンプトに関連もしくは類似する知見を取得する際に、前記利用者から指定された時点の情報に基づいて、当該時点において最新であった前記履歴から知見を取得する、言語モデル利用システム。
【請求項7】
言語モデルに利用者から指定されたプロンプトの文章を入力して、前記言語モデルから得られた回答を前記利用者に対して出力する情報処理システムによる言語モデル利用方法であって、
前記情報処理システムが、
前記プロンプトに基づいて、前記情報処理システムに蓄積された知見から前記プロンプトに関連もしくは類似する知見を取得する第1のステップと、
当該取得した知見と前記プロンプトとを合わせて前記言語モデルに入力して回答を得る第2のステップと、を実行する、言語モデル利用方法。
【請求項8】
請求項7に記載の言語モデル利用方法において、
前記第1のステップでは、前記プロンプトと、前記利用者の属性情報に基づいて、前記情報処理システムに蓄積された知見から前記プロンプトに関連もしくは類似する知見を取得する、言語モデル利用方法。
発明の詳細な説明
【技術分野】
【0001】
本発明は、生成AIやLLM(Large Language Models:大規模言語モデル)の利用技術に関し、特に、いわゆるプロンプトエンジニアリングを行う言語モデル利用システムおよび言語モデル利用方法に適用して有効な技術に関するものである。
続きを表示(約 2,000 文字)
【背景技術】
【0002】
昨今、ChatGPT(登録商標)をはじめ、驚異的な対話力・理解力を顕在化させたLLMが利用可能になっている。しかし、LLMに専門性の高い対話やタスク(例えば、文章の要約やQ&Aの作成、文章生成など)を行わせたい場合、対象の分野・ドメインに特化した下流タスクの学習が必要である。したがって、LLMを事業に活用するには最適な追加学習を行うことが必須となる。
【0003】
LLMに追加学習させる方法は複数存在するが、どのような方法を採ることができるかは、各LLMのモデルの公開方式に依存する。例えば、モデル自体が公開されていて商用利用可能なLLMであれば、様々な追加学習方法を採ることができるが、API(Application Programming Interface)のみが公開されているLLMでは、APIで行えるもしくはアクセスできる範囲のパラメータの更新などに制限される。
【0004】
自然言語モデルにおいて、RNN(Recurrent Neural Network:回帰型ニューラルネットワーク)やLSTM(Long Short Term Memory:長・短期記憶)などのアーキテクチャーが主流であった頃は、下流タスクやドメイン毎にゼロから学習し直させることが一般的であった。その後、BERT(Bidirectional Encoder Representations from Transformers)やGPT(Generative Pretrained Transformer)、BART(Bidirectional Auto-Regressive Transformer)などのいわゆるTransformer系の自然言語処理モデルをベースとした機械学習手法のモデルが登場して以降、言語に関する汎用的な理解を備えたベースモデルを構築する事前学習のステップと、上記ベースモデルについて特定ドメイン向けに追加学習(ファインチューニング)するステップの2ステップに分けて学習させるという手法が確立した。
【0005】
しかし、近年LLMの台頭により言語モデルが著しく大規模化した結果、ファインチューニングの対象のパラメータ数や、学習に用いるデータのサイズが膨大となり、計算リソース的に全パラメータを更新するような従来型のファインチューニングは実用上困難となってきた。また、学習済みモデルが非公開でAPI等によるアクセスもできないなど、パラメータに対するアクセス権がないような場合は、そもそも全パラメータを更新するようなファインチューニングを行うことはできない。
【0006】
これに対し、パラメータの更新に代えて、LLMに対話やタスクを行わせる際の入力(プロンプト)の内容を最適化したり追加のプロンプトやパラメータ、タスクの例示などの情報を挿入したりすることで、LLMに未知の知見を与えながら対話するという、いわゆるプロンプトエンジニアリング(In-Context Learning)も検討されている。これにより、例えば、事前学習の際に用いられたデータには含まれていない最新の知見をLLMに与えて、学習済みの知見の陳腐化を解消することが可能となる。
【0007】
これに関連する技術として、例えば、非特許文献1には、ユーザからの質問をベクトル化し、(未知の知見を含む)大量の文書の中から質問に関連する文書をベクトルの類似度により検索するRetrieverと、Retrieverにより検索された関連文書と質問文を連結して言語モデルに入力として与えて回答を抽出または生成するReaderで構成されるRetriever-Readerモデルが記載されている。
【先行技術文献】
【非特許文献】
【0008】
蓬田綾香、外7名、“技術ナレッジ活用に向けたRetriever-Readerモデルの検証”、言語処理学会 第29回年次大会 発表論文集、2023年3月、p.2030-2033
【発明の概要】
【発明が解決しようとする課題】
【0009】
LLMに対して入力できるプロンプトの長さ(トークンの数)には制限がある中で、追加学習させたい外部の知見が膨大にあるような場合に、従来技術によれば、膨大な外部の知見から関連する文書を抽出して、質問文と連結してプロンプトとしてLLMに与えるというプロンプトエンジニアリングにより、LLMに未知の知見を与えながら対話して回答を得るということが可能である。
【0010】
しかし、蓄積されているLLMの外部の知見の中には、社内の機密情報など外部に流出させられないものもあり、SaaS(Software as a Service)として利用可能なオープンなLLMに対して入力するのが不適切なものもある。
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
個人
裁判のAI化
25日前
個人
情報処理システム
1か月前
個人
フラワーコートA
4日前
個人
検査システム
1か月前
個人
介護情報提供システム
11日前
個人
設計支援システム
17日前
個人
設計支援システム
17日前
キヤノン電子株式会社
携帯装置
1か月前
株式会社サタケ
籾摺・調製設備
1か月前
株式会社カクシン
支援装置
20日前
個人
備蓄品の管理方法
1か月前
個人
アンケート支援システム
6日前
キヤノン株式会社
情報処理装置
1か月前
個人
ジェスチャーパッドのガイド部材
10日前
サクサ株式会社
中継装置
1か月前
サクサ株式会社
中継装置
7日前
キヤノン株式会社
情報処理装置
1か月前
東洋電装株式会社
操作装置
1か月前
東洋電装株式会社
操作装置
1か月前
個人
リテールレボリューションAIタグ
3日前
アスエネ株式会社
排水量管理方法
1か月前
株式会社アジラ
移動方向推定装置
5日前
キヤノン電子株式会社
名刺管理システム
1か月前
株式会社寺岡精工
システム
10日前
株式会社アザース
企業連携システム
11日前
日本電気株式会社
システム及び方法
19日前
株式会社JVCケンウッド
管理装置
1か月前
株式会社リ・パワー
電力入札システム
7日前
個人
会話評価装置
17日前
アスエネ株式会社
廃棄物排出量管理方法
1か月前
株式会社創造工舎
提示項目確認システム
5日前
株式会社セラク
集出荷方法及びシステム
18日前
キヤノン株式会社
通信端末
1か月前
株式会社寺岡精工
顔認証システム
1か月前
株式会社mov
情報処理システム
19日前
個人
竹資源の生産・販売・分配システム
14日前
続きを見る
他の特許を見る