TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025121072
公報種別
公開特許公報(A)
公開日
2025-08-19
出願番号
2024016269
出願日
2024-02-06
発明の名称
計算機システム及びパラメータ探索支援方法
出願人
株式会社日立製作所
代理人
藤央弁理士法人
主分類
G06F
40/56 20200101AFI20250812BHJP(計算;計数)
要約
【課題】自然言語処理モデルの利用を含む複数の処理から構成されるタスクのパラメータの組合せの探索を低コストで実現する。
【解決手段】計算機システムは、コストに基づいて分類された、第1分類の自然言語処理モデル及び第2分類の自然言語処理モデルの相関関係を管理するための相関情報と、第1分類の自然言語処理モデルを用いたテキスト生成処理を一つ以上含む複数の処理から構成されるターゲットタスクの各処理を制御するためのパラメータの組合せであるパラメータセットを管理するための第1パラメータセット情報と、を保持し、相関情報を参照して、第2分類の自然言語処理モデルの中から前記第1自然言語処理モデルと相関がある検証用自然言語処理モデルを特定し、第1パラメータセットを変えながら、検証用自然言語処理モデルを用いたタスク、及びタスクの実行結果を評価するための評価指標の算出、を実行し、評価指標に基づいて、候補となるパラメータセットを決定する。
【選択図】 図1
特許請求の範囲
【請求項1】
計算機システムであって、
プロセッサ、前記プロセッサに接続される記憶装置、及び前記プロセッサに接続されるネットワークインタフェースを有する計算機を備え、
指示を含むテキストであるプロンプトを受け付け、自然言語処理モデルを用いて出力テキストを生成するテキスト生成システムにアクセス可能に接続され、
前記自然言語処理モデルの利用に伴って発生するコストに基づいて分類された、第1分類の前記自然言語処理モデル及び第2分類の前記自然言語処理モデルの相関関係を管理するための相関情報と、前記第1分類の前記自然言語処理モデルであるターゲット自然言語処理モデルを用いたテキスト生成処理を一つ以上含む複数の処理から構成されるターゲットタスクの前記複数の処理の各々を制御するためのパラメータの組合せである第1パラメータセットを管理するための第1パラメータセット情報と、を保持し、
前記第1分類の前記自然言語処理モデルの前記コストは、前記第2分類の前記自然言語処理モデルの前記コストより大きく、
前記計算機システムは、
前記相関情報を参照して、前記第2分類の前記自然言語処理モデルの中から前記ターゲット自然言語処理モデルと相関がある検証用自然言語処理モデルを特定し、
前記第1パラメータセットを変えながら、前記検証用自然言語処理モデルを用いた前記ターゲットタスク、及び前記ターゲットタスクの実行結果を評価するための第1評価指標の算出、を実行し、
前記第1評価指標に基づいて、候補となる前記第1パラメータセットを決定することを特徴とする計算機システム。
続きを表示(約 3,300 文字)
【請求項2】
請求項1に記載の計算機システムであって、
前記第1評価指標及び閾値の比較結果に基づいて、候補となる前記第1パラメータセットを特定し、
候補となる前記第1パラメータセットが一つである場合、当該第1パラメータセットを表示するための表示情報を生成し、
候補となる前記第1パラメータセットが複数ある場合、前記第1パラメータセットを変えながら、前記ターゲット自然言語処理モデルを用いた前記ターゲットタスクを実行し、前記第1パラメータセット及び前記ターゲットタスクの実行結果を表示するための表示情報を生成することを特徴とする計算機システム。
【請求項3】
請求項2に記載の計算機システムであって、
前記自然言語処理モデルを用いたテキスト生成処理を一つ以上含む複数の処理から構成される分析用タスクの前記複数の処理の各々を制御するためのパラメータの組合せである第2パラメータセットを管理するための第2パラメータセット情報を保持し、
前記第1分類の前記自然言語処理モデルの各々について、前記第2パラメータセットを変えながら、前記第1分類の前記自然言語処理モデルを用いた前記分析用タスク、及び前記分析用タスクの実行結果を評価するための第2評価指標の算出、を実行し、
前記第1分類の前記自然言語処理モデルの各々について、前記第2評価指標に基づいて、前記分析用タスクの実行結果が良好である前記第2パラメータセットを抽出することによって第1リストを生成し、
前記第2分類の前記自然言語処理モデルの各々について、前記第2パラメータセットを変えながら、前記第2分類の前記自然言語処理モデルを用いた前記分析用タスク、及び前記第2評価指標の算出、を実行し、
前記第2分類の前記自然言語処理モデルの各々について、前記第2評価指標に基づいて、前記分析用タスクの実行結果が良好である前記第2パラメータセットを抽出することによって第2リストを生成し、
前記第1分類の前記自然言語処理モデル及び前記第2分類の前記自然言語処理モデルの組合せの各々について、前記第1リスト及び前記第2リストに基づいて、前記第2パラメータセットの一致度合いを相関指標として算出し、
前記第1分類の前記自然言語処理モデル及び前記第2分類の前記自然言語処理モデルの組合せ、並びに、前記相関指標を対応づけることによって前記相関情報を生成することを特徴とする計算機システム。
【請求項4】
請求項3に記載の計算機システムであって、
前記テキスト生成処理を制御するためのパラメータは、前記プロンプトの指示の内容であることを特徴とする計算機システム。
【請求項5】
計算機システムが実行するパラメータ探索支援方法であって、
前記計算機システムは、
プロセッサ、前記プロセッサに接続される記憶装置、及び前記プロセッサに接続されるネットワークインタフェースを有する計算機を含み、
指示を含むテキストであるプロンプトを受け付け、自然言語処理モデルを用いて出力テキストを生成するテキスト生成システムにアクセス可能に接続され、
前記自然言語処理モデルの利用に伴って発生するコストに基づいて分類された、第1分類の前記自然言語処理モデル及び第2分類の前記自然言語処理モデルの相関関係を管理するための相関情報と、前記第1分類の前記自然言語処理モデルであるターゲット自然言語処理モデルを用いたテキスト生成処理を一つ以上含む複数の処理から構成されるターゲットタスクの前記複数の処理の各々を制御するためのパラメータの組合せである第1パラメータセットを管理するための第1パラメータセット情報と、を保持し、
前記第1分類の前記自然言語処理モデルの前記コストは、前記第2分類の前記自然言語処理モデルの前記コストより大きく、
前記パラメータ探索支援方法は、
前記計算機システムが、前記相関情報を参照して、前記第2分類の前記自然言語処理モデルの中から前記ターゲット自然言語処理モデルと相関がある検証用自然言語処理モデルを特定する第1のステップと、
前記計算機システムが、前記第1パラメータセットを変えながら、前記検証用自然言語処理モデルを用いた前記ターゲットタスク、及び前記ターゲットタスクの実行結果を評価するための第1評価指標の算出、を実行する第2のステップと、
前記計算機システムが、前記第1評価指標に基づいて、候補となる前記第1パラメータセットを決定する第3のステップと、を含むことを特徴とするパラメータ探索支援方法。
【請求項6】
請求項5に記載のパラメータ探索支援方法であって、
前記第3のステップは、
前記計算機システムが、前記第1評価指標及び閾値の比較結果に基づいて、候補となる前記第1パラメータセットを特定するステップと、
前記計算機システムが、候補となる前記第1パラメータセットが一つである場合、当該第1パラメータセットを表示するための表示情報を生成するステップと、
前記計算機システムが、候補となる前記第1パラメータセットが複数ある場合、前記第1パラメータセットを変えながら、前記ターゲット自然言語処理モデルを用いた前記ターゲットタスクを実行し、前記第1パラメータセット及び前記ターゲットタスクの実行結果を表示するための表示情報を生成するステップと、を含むことを特徴とするパラメータ探索支援方法。
【請求項7】
請求項6に記載のパラメータ探索支援方法であって、
前記計算機システムは、前記自然言語処理モデルを用いたテキスト生成処理を一つ以上含む複数の処理から構成される分析用タスクの前記複数の処理の各々を制御するためのパラメータの組合せである第2パラメータセットを管理するための第2パラメータセット情報を保持し、
前記パラメータ探索支援方法は、
前記計算機システムが、前記第1分類の前記自然言語処理モデルの各々について、前記第2パラメータセットを変えながら、前記第1分類の前記自然言語処理モデルを用いた前記分析用タスク、及び前記分析用タスクの実行結果を評価するための第2評価指標の算出、を実行するステップと、
前記計算機システムが、前記第1分類の前記自然言語処理モデルの各々について、前記第2評価指標に基づいて、前記分析用タスクの実行結果が良好である前記第2パラメータセットを抽出することによって第1リストを生成するステップと、
前記計算機システムが、前記第2分類の前記自然言語処理モデルの各々について、前記第2パラメータセットを変えながら、前記第2分類の前記自然言語処理モデルを用いた前記分析用タスク、及び前記第2評価指標の算出、を実行するステップと、
前記計算機システムが、前記第2分類の前記自然言語処理モデルの各々について、前記第2評価指標に基づいて、前記分析用タスクの実行結果が良好である前記第2パラメータセットを抽出することによって第2リストを生成するステップと、
前記計算機システムが、前記第1分類の前記自然言語処理モデル及び前記第2分類の前記自然言語処理モデルの組合せの各々について、前記第1リスト及び前記第2リストに基づいて、前記第2パラメータセットの一致度合いを相関指標として算出するステップと、
前記計算機システムが、前記第1分類の前記自然言語処理モデル及び前記第2分類の前記自然言語処理モデルの組合せ、並びに、前記相関指標を対応づけることによって前記相関情報を生成するステップと、を含むことを特徴とするパラメータ探索支援方法。
【請求項8】
請求項7に記載のパラメータ探索支援方法であって、
前記テキスト生成処理を制御するためのパラメータは、前記プロンプトの指示の内容であることを特徴とするパラメータ探索支援方法。
発明の詳細な説明
【技術分野】
【0001】
本発明は、生成AIの利用を含む複数の処理から構成されるタスクの各処理を制御するパラメータを探索する技術に関する。
続きを表示(約 2,100 文字)
【背景技術】
【0002】
近年、ユーザから指示を受け付け、テキストを生成する生成AIが登場している(例えば、非特許文献1及び非特許文献2を参照)。本発明では、生成AIは大規模言語モデル(LLM)を意味する。大規模言語モデルは、自然言語処理モデルの一つであり、様々な言語処理タスクを実行できる。
【0003】
生成AIには、有償のものと無償のものとがある。有償の生成AIでは、入力テキストのトークン数に応じて費用が発生する。例えば、有償の生成AIであるGPT-4に、例えば1000トークンの入力テキストを入力した場合、約10円の費用が発生する。
【先行技術文献】
【特許文献】
【0004】
OpenAI, R. "GPT-4 technical report." arXiv (2023): 2303-08774.
Mosaic ML, "Introducing MPT-7B: A New Standard for Open-Source, Commercially Usable LLMs", [online],[令和5年12月25日検索],インターネット<URL: https://www.mosaicml.com/blog/mpt-7b>.
LangChain,[online],[令和5年12月25日検索],インターネット<URL:https://www.langchain.com/>
【発明の概要】
【発明が解決しようとする課題】
【0005】
有償の生成AIを用いて、文書の要点を抽出し、分析するために、100トークンのテキストである10000個の文書を要約するタスクを考える。この場合、生成AIには100万トークンのテキストが入力される。生成AIには一度に入力できるトークン数に上限があるため、前述のタスクをそのまま生成AIに実行させることは困難である。
【0006】
これに対して、生成AIへの入力及び出力をつなげて、複雑なタスクを実現する技術が知られている(非特許文献3を参照)。
【0007】
前述のタスクは、非特許文献3に記載の技術を用いると、入力テキストの分割、分割したテキストの生成AIへの入力、生成AIが出力した複数のテキストの集約、集約したテキストの生成AIへの入力を連結したタスクとして実現できる。このとき、生成AIへの指示を含むテキストであるプロンプトを介して生成AIへの入力、分割、及び集約の各々を制御するパラメータを設定する必要がある。
【0008】
前述のタスクを効率的に実行するためには、事前に最適なパラメータの組合せ(パラメータセット)を見つける必要がある。分割及び集約のそれぞれのパラメータが10パターンある場合、最適なパラメータの組合せを見つけるためにはタスクを100回試行する必要がある。有償の生成AIを用いた場合、約100万円の費用が発生する。
【0009】
生成AIの利用を含む複数の処理から構成されるタスクの各処理を制御するためのパラメータを決定する場合、無償の生成AIを用いて検証するパラメータの組合せを絞り込みことが有効である。
【課題を解決するための手段】
【0010】
本願において開示される発明の代表的な一例を示せば以下の通りである。すなわち、計算機システムであって、プロセッサ、前記プロセッサに接続される記憶装置、及び前記プロセッサに接続されるネットワークインタフェースを有する計算機を備え、指示を含むテキストであるプロンプトを受け付け、自然言語処理モデルを用いて出力テキストを生成するテキスト生成システムにアクセス可能に接続され、前記自然言語処理モデルの利用に伴って発生するコストに基づいて分類された、第1分類の前記自然言語処理モデル及び第2分類の前記自然言語処理モデルの相関関係を管理するための相関情報と、前記第1分類の前記自然言語処理モデルであるターゲット自然言語処理モデルを用いたテキスト生成処理を一つ以上含む複数の処理から構成されるターゲットタスクの前記複数の処理の各々を制御するためのパラメータの組合せである第1パラメータセットを管理するための第1パラメータセット情報と、を保持し、前記第1分類の前記自然言語処理モデルの前記コストは、前記第2分類の前記自然言語処理モデルの前記コストより大きく、前記計算機システムは、前記相関情報を参照して、前記第2分類の前記自然言語処理モデルの中から前記ターゲット自然言語処理モデルと相関がある検証用自然言語処理モデルを特定し、前記第1パラメータセットを変えながら、前記検証用自然言語処理モデルを用いた前記ターゲットタスク、及び前記ターゲットタスクの実行結果を評価するための評価指標の算出、を実行し、前記評価指標に基づいて、候補となる前記第1パラメータセットを決定する。
【発明の効果】
(【0011】以降は省略されています)
この特許をJ-PlatPat(特許庁公式サイト)で参照する
関連特許
株式会社日立製作所
制御装置
3日前
株式会社日立製作所
レール把持装置
今日
株式会社日立製作所
設計支援装置および設計支援方法
今日
株式会社日立製作所
情報処理システム及び情報処理方法
3日前
株式会社日立製作所
管理装置、管理方法、及び制御システム
3日前
株式会社日立製作所
計算機システム及びITシステムの障害調査支援方法
今日
株式会社日立製作所
文章生成システム、文章生成プログラム、および、報告書データベースの生産方法
今日
株式会社日立製作所
不良検出学習装置、画像検査装置、画像検査システム、不良検出学習方法、及びプログラム
3日前
個人
裁判のAI化
1か月前
個人
情報処理システム
1か月前
個人
フラワーコートA
25日前
個人
工程設計支援装置
17日前
個人
検査システム
1か月前
個人
介護情報提供システム
1か月前
個人
設計支援システム
1か月前
個人
設計支援システム
1か月前
個人
携帯情報端末装置
18日前
株式会社サタケ
籾摺・調製設備
1か月前
キヤノン電子株式会社
携帯装置
1か月前
個人
不動産売買システム
2か月前
個人
結婚相手紹介支援システム
14日前
株式会社カクシン
支援装置
1か月前
個人
パスポートレス入出国システム
3日前
株式会社アジラ
進入判定装置
3日前
個人
アンケート支援システム
27日前
個人
備蓄品の管理方法
1か月前
サクサ株式会社
中継装置
28日前
個人
ジェスチャーパッドのガイド部材
1か月前
キヤノン株式会社
情報処理装置
1か月前
キヤノン株式会社
情報処理装置
1か月前
サクサ株式会社
中継装置
1か月前
個人
食事受注会計処理システム
4日前
大阪瓦斯株式会社
住宅設備機器
11日前
株式会社やよい
美容支援システム
7日前
株式会社東芝
電子機器
2か月前
東洋電装株式会社
操作装置
1か月前
続きを見る
他の特許を見る