TOP特許意匠商標
特許ウォッチ Twitter
公開番号2025126090
公報種別公開特許公報(A)
公開日2025-08-28
出願番号2024033371
出願日2024-02-16
発明の名称RAG装置・方式における生成AI用プロンプト生成装置および方法
出願人メタデータ株式会社
代理人
主分類G06F 16/9035 20190101AFI20250821BHJP(計算;計数)
要約【課題】従来方式では回答内容や表現を適切に絞り込めないまま、無関係かつ有害なプロンプト情報の文字数が増大し、利用料金が増大し回答精度、応答速度が低下する問題点を解決する。
【解決手段】 知識・情報の管理を効率化するために、知識・情報を、ベクトルデータ格納手段(2)において複数の階層と複数のデータセット22に分けて管理し、質問文とデータセット22との間で類似・関連検索を行い、知識・情報を結合する際に、当該の付随するデータセットプロンプト(5)のみを結合の対象とする。請求項2では、互いに関連する情報をどれだけ近傍に配置するかを決定する処理を行うことにより、出力先の生成AIの能力に応じて最適化する。請求項3に記載の予め「意味ラベルをベクトルの要素に導入」して類似度計算をすることにより、データセット22に出現しない単語を用いた質問文を入力手段(1)が受け付けた場合でも、回答精度を向上させることができる。
【選択図】図1
特許請求の範囲【請求項1】
生成AI用プロンプト生成装置および方法であって、入力データを受け取る入力手段(1)を備え、社内マニュアル等の専門知識、ローカル情報を知識素片をレコード単位としたベクトルデータ格納手段(2)を備え、入力データとに基づいて生成AI用のプロンプトを作成する生成モジュール(3)を備え、生成AI用のプロンプトを出力する出力手段(4)を備え、前記ベクトルデータ格納手段(2)の内部が複数のデータセットに分かれて構成され、各データセットに付随して、当該データセット内部の知識レコードが入力データとcosine値等による高い類似性を示した際に、「前提知識」等のラベルとともに生成AIへ送出するデータセットプロンプト(5)を備えることを特徴としたRAG装置・方式における生成AI用プロンプト生成装置および方法。
続きを表示(約 520 文字)【請求項2】
請求項1に記載の生成AI用プロンプト生成装置および方法であって、生成モジュール(3)が以下の処理を実行することを特徴とするもの:
- 入力データを解析し、互いに関連する情報を抽出する処理
- 抽出した情報を元に、生成AI用のプロンプトを自動的に作成する処理
- 作成されたプロンプトの適切性を評価し、必要に応じて修正する処理
- 使用する生成AIがどれだけ広範囲の文脈内で情報の関連付けを行えるかの能力に応じて、互いに関連する情報をどれだけ近傍に配置するかを決定する処理
【請求項3】
請求項1に記載の生成AI用プロンプト生成装置および方法であって、生成モジュール(3)が以下の手法を使用してプロンプトを作成することを特徴とするもの:
- cosine値等により各知識レコードの質問文との類似性、関連性を判定する際に、事前学習済の意味ラベルをベクトルの要素に導入し、単語の要素からなるベクトルのcosine類似度に加えて、ユーザが設定した重みで意味ラベルの要素からなるベクトルのcosine類似度を併用して各知識レコードの質問文との類似性、関連性を判定する処理

発明の詳細な説明【技術分野】
【0001】
本発明は、自然言語対話能力を有するChatGPTのような生成AIに対して、もっぱら専門知識、ローカル情報に基づいて回答させるための知識・情報をベクトルデータで格納し、ベクトルデータの類似度・関連度に基づいて検索を行い、ヒットした知識・情報を生成AIのAPIに送出する仕組みを備えたRAG(Retrieval Augmented Generation)に基づく生成AI用プロンプト生成装置および方法に関するものである。
続きを表示(約 2,300 文字)【背景技術】
【0002】
自然言語対話能力を有するChatGPTのような生成AIに対して、もっぱら専門知識、ローカル情報に基づいて回答させるための知識・情報をベクトルデータで格納し、ベクトルデータの類似度・関連度に基づいて検索を行い、ヒットした知識・情報を生成AIのAPIに送出する仕組みを備えたRAG(Retrieval Augmented Generation)に基づく生成AI用プロンプト生成方法が公知である(非特許文献1)。
【0003】
近年、人工知能(AI)の技術が急速に進歩しており、特に生成AIは自動的に文章や画像を生成する能力に優れている。生成AIは、自然言語処理の分野で広く利用され、文章の自動生成、翻訳、要約などのタスクに応用されている。一方、公開情報をもとに事前学習された汎用の生成AIは、「うちの総務の外線番号なんだったっけ?」のような質問文にみられる社内知識やローカル情報に回答する能力はもたない。このため、産業応用が限定的となる問題点があった。自然言語文による問い合わせに対して何らかの仕組みに基づいて回答を行う、RAG(Retrieval Augmented Generation)登場以前の返答文作成方法は、特許文献1などにみられるように公知であるが、予め定義された質問文と回答文の組み合わせのバリエーションに基づく返答しかできず、応用用途は限定的であった。
【0004】
この問題を解決するため、非特許文献1にみられるRAG(Retrieval Augmented Generation)という方式では、ユーザの質問文とは別に、専門知識、ローカル情報をベクトルデータとしてあらかじめ格納し、その中で質問文と関連の深い一部だけを取り出して数百文字から数万文字程度を生成AIに送出することで、もっぱら格納された専門知識、ローカル情報から返答させることについて一定の成功を収めた。
【先行技術文献】
【特許文献】
【0005】
特開平2003-243086号公報 [発明の名称]返答文生成装置及び方法、並びにプログラム
【非特許文献】
【0006】
Patrick Lewis,Ethan Perez 他著 ″Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks″
【発明の概要】
【発明が解決しようとする課題】
【0007】
上記のように公知の方法で構築されたRAG装置には、ベクトルデータの中から質問文に正しく関連した、正解を含むデータを取り出すのに失敗したり、取り出された文字量が多すぎて、無関係のノイズなどが大量に生成AIに送られたりして、生成AIが正しい回答を出せなくなる、精度低下の課題があった。また、多種多彩な質問、例えば社内であれば、総務、法務、経理、開発部門などによって異なる回答スタイルを指示する複数種類のプロンプトを用意すべきであるにも関わらず、いわゆるコンシエルジェのように1つだけの窓口対話ボットに対応させる場合、従来のRAG装置・方式では回答内容や表現を適切に絞り込めないまま、無関係かつ有害なプロンプト情報の文字数が増大し、利用料金が無駄に増大するとともに、生成AIの回答精度、応答速度が低下するという問題点が生じている。
【0008】
そこで、本発明は、社内知識やローカル情報のジャンルごとベクトルデータベースを分割し、プロンプトをも各々に付随するプロンプトに分割(分割されたものをデータセットプロンプトと呼ぶ)し、検索結果から最終的に生成AIに送出するデータを適切に結合、構成するプロンプト生成装置および方法を提供することで、上記の課題を解決する。本発明の装置および方法の目的は、高速かつ正確に生成AIに送出するデータを作成し、ユーザの利用コストを削減し、回答精度を向上させ、応答速度を速くすることにある。
【課題を解決するための手段】
【0009】
本発明では、知識・情報の管理を効率化するために、知識・情報を、ベクトルデータ格納手段(2)において複数の階層と複数のデータセット22に分けて管理する仕組みを提供する。複数の階層の上位にあるのは、全体プロンプト21であり、質問文を専門知識、ローカル情報の一部と生成モジュール(3)で結合して出力手段(4)に送る際に、毎回結合され、生成AIに対して回答の仕方などの指示を行う。階層の中位にあるのがデータセットプロンプト(5)である。階層の末端には、データセット22があり、ここには、実際の知識・情報(例:社内マニュアルの特定部分の記述)が搭載される。ベクトル間のCosine類似度等を利用して、質問文とデータセットとの間で類似・関連検索を行い、ヒットした上位の知識・情報を生成モジュール(3)が結合して出力手段(4)に送る際に、当該の知識・情報を含むデータセット22に付随するデータセットプロンプト(5)のみを結合の対象とする。
【発明の効果】
【0010】
これにより、質問文に無関係なデータセットプロンプト(5)を排除し、少ない文字量の生成結果を生成モジュール(3)が生成し、その中で正しい回答に関連の高い内容の知識・情報を増やすことで、出力手段(4)から生成結果を受け取った生成AIはより適切な回答を生成することができる。
(【0011】以降は省略されています)

この特許をJ-PlatPat(特許庁公式サイト)で参照する

関連特許

個人
対話装置
2か月前
個人
裁判のAI化
1か月前
個人
フラワーコートA
22日前
個人
情報処理システム
1か月前
個人
工程設計支援装置
14日前
個人
検査システム
1か月前
個人
情報処理装置
2か月前
個人
記入設定プラグイン
2か月前
個人
介護情報提供システム
29日前
個人
携帯情報端末装置
15日前
個人
設計支援システム
1か月前
個人
設計支援システム
1か月前
個人
情報入力装置
2か月前
株式会社サタケ
籾摺・調製設備
1か月前
個人
不動産売買システム
1か月前
個人
結婚相手紹介支援システム
11日前
キヤノン電子株式会社
携帯装置
1か月前
個人
物価スライド機能付生命保険
2か月前
株式会社カクシン
支援装置
1か月前
個人
備蓄品の管理方法
1か月前
個人
マイホーム非電子入札システム
2か月前
個人
アンケート支援システム
24日前
個人
パスポートレス入出国システム
今日
株式会社アジラ
進入判定装置
今日
サクサ株式会社
中継装置
25日前
大阪瓦斯株式会社
住宅設備機器
8日前
個人
ジェスチャーパッドのガイド部材
28日前
株式会社BONNOU
管理装置
2か月前
個人
食事受注会計処理システム
1日前
キヤノン株式会社
情報処理装置
1か月前
キヤノン株式会社
情報処理装置
1か月前
サクサ株式会社
中継装置
1か月前
キヤノン電子株式会社
名刺管理システム
1か月前
株式会社やよい
美容支援システム
4日前
株式会社アジラ
移動方向推定装置
23日前
アスエネ株式会社
排水量管理方法
1か月前
続きを見る