TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025139724
公報種別公開特許公報(A)
公開日2025-09-29
出願番号2024038713
出願日2024-03-13
発明の名称データ変換装置、データ変換方法、およびデータ変換プログラム
出願人株式会社日立製作所
代理人藤央弁理士法人
主分類G06F 40/151 20200101AFI20250919BHJP(計算;計数)
要約【課題】評価対象に対する質問文の形式の適正化を図ること。
【解決手段】プログラムを実行するプロセッサと、前記プログラムを記憶する記憶デバイスと、を有するデータ変換装置は、複数の選択肢と前記複数の選択肢の中の1つを正答とする第1質問文とを入力する入力処理と、前記入力処理によって入力された前記複数の選択肢および前記第1質問文に基づいて、前記第1質問文を前記第1質問文の形式とは異なる形式の第2質問文に変換する変換処理と、前記変換処理によって変換された第2質問文と前記複数の選択肢とを出力する出力処理と、を実行する。
【選択図】図2
特許請求の範囲【請求項1】
プログラムを実行するプロセッサと、前記プログラムを記憶する記憶デバイスと、を有するデータ変換装置であって、
前記プロセッサは、
複数の選択肢と前記複数の選択肢の中の1つを正答とする第1質問文とを入力する入力処理と、
前記入力処理によって入力された前記複数の選択肢および前記第1質問文に基づいて、前記第1質問文を前記第1質問文の形式とは異なる形式の第2質問文に変換する変換処理と、
前記変換処理によって変換された第2質問文と前記複数の選択肢とを出力する出力処理と、
を実行することを特徴とするデータ変換装置。
続きを表示(約 1,400 文字)【請求項2】
請求項1に記載のデータ変換装置であって、
前記第2質問文は、前記正答で補完することにより完成する一部が欠落した補完形式の説明文である、
ことを特徴とするデータ変換装置。
【請求項3】
請求項1に記載のデータ変換装置であって、
前記第1質問文は、前記複数の選択肢の中からいずれが前記正答であるかを問う疑問文である、
ことを特徴とするデータ変換装置。
【請求項4】
請求項1に記載のデータ変換装置であって、
前記第1質問文は、前記正答を指示代名詞で表現した平叙文である、
ことを特徴とするデータ変換装置。
【請求項5】
請求項1に記載のデータ変換装置であって、
前記変換処理では、前記プロセッサは、前記第1質問文内の先頭からの単語列の次の単語を予測する予測処理を実行することにより、前記第2質問文を生成する、
ことを特徴とするデータ変換装置。
【請求項6】
請求項1に記載のデータ変換装置であって、
単語列の次の単語を予測する言語モデルを実装する計算機にアクセス可能であり、
前記変換処理では、前記プロセッサは、前記第1質問文を前記計算機に送信した結果、前記計算機によって生成された前記第2質問文を受信する、
ことを特徴とするデータ変換装置。
【請求項7】
請求項1に記載のデータ変換装置であって、
前記プロセッサは、
前記第2質問文の単語列と前記選択肢の単語列とに基づいて、前記第2質問文が生成される尤もらしさを示すスコアを前記選択肢ごとに取得する取得処理を実行し、
前記出力処理では、前記プロセッサは、前記取得処理によって取得された前記選択肢ごとの前記スコアを出力する、
ことを特徴とするデータ変換装置。
【請求項8】
請求項7に記載のデータ変換装置であって、
質問の単語列と前記質問に対する回答の単語列とに基づいて前記質問が生成される前記回答の尤もらしさを予測する言語モデルを実装する計算機にアクセス可能であり、
前記取得処理では、前記プロセッサは、前記第2質問文の単語列と前記選択肢の単語列とを前記計算機に送信した結果、前記計算機によって算出された前記第2質問文が生成される前記選択肢の尤もらしさを示すスコアを前記選択肢ごとにする、
ことを特徴とするデータ変換装置。
【請求項9】
請求項7に記載のデータ変換装置であって、
前記プロセッサは、
前記スコアに基づいて、前記第2質問文に対する言語モデルの性能を示す指標値を算出する算出処理を実行する、
ことを特徴とするデータ変換装置。
【請求項10】
請求項1に記載のデータ変換装置であって、
前記変換処理では、前記プロセッサは、前記第1質問文の構文木を解析し、前記構文木の各部分木を所定のルールにマッチングし、マッチしたルールに関連付けられる操作方法に基づいて前記第1質問文の単語の順番を入れ替え、所定の単語を補うことにより、前記第2質問文を生成する、
ことを特徴とするデータ変換装置。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本発明は、データを変換するデータ変換装置、データ変換方法、およびデータ変換プログラムに関する。
続きを表示(約 2,400 文字)【背景技術】
【0002】
近年は、Generative Pretrained Transformer(GPT)やBidirectional Encoder Representations from Transformers(BERT)に代表される言語モデルの発展が著しい。これらの言語モデルは基盤モデルなどとも称され、テキスト生成、文書分類、翻訳、画像キャプション生成、文法解析など様々な下流タスクに利用される。
【0003】
言語モデルは、外部知識利用、前後処理、追加の教師付き学習を含む統合システムとして下流タスクで評価されうる。しかし、統合システムの構築には多大なコストがかかり、言語モデル以外の部分の完成度が下流タスクの性能に大きな影響を与える。このため、言語モデルの単体評価ができることが望ましい。
【0004】
現在では、言語モデルの単体評価に向け専用に作られた評価データおよび評価方法が存在する。一般的なドメインにおいては、これらの評価データおよび評価方法を利用することで言語モデルの単体評価が可能である。しかし、たとえば、特定ドメインに向け新たに言語モデルを作成する場合は、これらの評価データおよび評価方法だけでは不十分である。
【0005】
また、これらの評価データおよび評価方法は人間によって作成されたため、同様の手順で特定ドメインに向けた評価データおよび評価方法を構築すると、コストが高くなる。一方、それらの特定ドメインにおいても、人間向けの試験や演習問題が存在していることがある。ただし、言語モデルは一般的にテキストの穴埋め問題や補完問題を通し統計的に構築されるのに対して、人間向けの問題は選択肢問題なども含みうる。このため、人間向けの問題を通して言語モデルの評価を行うためには、前述したように言語モデルに外部知識利用、前後処理、追加の教師付き学習などを組み込む必要がある。したがって、言語モデルの単体評価を行うことは難しい。
【0006】
下記非特許文献1は、言語モデルの評価方法を開示する。下記非特許文献2は、後方補完に基づく言語モデルの評価方法を開示する。下記非特許文献3は、テキスト断片をツリーにマッピングするテキスト断片間の遷移ラベルの予測としてタスクを定式化する機械学習システムを開示する。
【先行技術文献】
【非特許文献】
【0007】
Alec Radford, Jeffrey Wu, Rewon Child, David Luan, Dario Amodei, Ilya Sutskever. 2018. Language Models are Unsupervised Multitask Learners. OpenAI Blog.
Rowan Zellers, Ari Holtzman, Yonatan Bisk, Ali Farhadi, and Yejin Choi. 2019. HellaSwag: Can a Machine Really Finish Your Sentence?. In Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics, pages 4791-4800, Florence, Italy. Association for Computational Linguistics.
Yuta Koreeda and Christopher Manning. 2021. Capturing Logical Structure of Visually Structured Documents with Multimodal Transition Parser. In Proceedings of the Natural Legal Language Processing Workshop 2021, pages 144-154, Punta Cana, Dominican Republic. Association for Computational Linguistics.
【発明の概要】
【発明が解決しようとする課題】
【0008】
非特許文献1に開示されている四択問題に基づく評価方法は、問題文の整形方法(プロンプトの作成方法)に依存することが知られており、同じ言語モデルでも様々な性能が報告されているのが現状である。非特許文献2で開示されている評価方法は、人手で時間をかけ構築された評価方法であり、評価方法を構築するための装置や方法については開示されていない。
【0009】
本発明は、評価対象に対する質問文の形式の適正化を図ることを目的とする。
【課題を解決するための手段】
【0010】
本願において開示される発明の一側面となるデータ変換装置は、プログラムを実行するプロセッサと、前記プログラムを記憶する記憶デバイスと、を有するデータ変換装置であって、前記プロセッサは、複数の選択肢と前記複数の選択肢の中の1つを正答とする第1質問文とを入力する入力処理と、前記入力処理によって入力された前記複数の選択肢および前記第1質問文に基づいて、前記第1質問文を前記第1質問文の形式とは異なる形式の第2質問文に変換する変換処理と、前記変換処理によって変換された第2質問文と前記複数の選択肢とを出力する出力処理と、を実行することを特徴とする。
【発明の効果】
(【0011】以降は省略されています)

この特許をJ-PlatPat(特許庁公式サイト)で参照する

関連特許

株式会社日立製作所
制御装置
1か月前
株式会社日立製作所
鉄道車両
6日前
株式会社日立製作所
半導体装置
14日前
株式会社日立製作所
レール把持装置
1か月前
株式会社日立製作所
電動機制御装置
1か月前
株式会社日立製作所
ガス濃度測定装置
6日前
株式会社日立製作所
環境評価システム
1か月前
株式会社日立製作所
機能割付システム
1か月前
株式会社日立製作所
航空機用の推進装置
1か月前
株式会社日立製作所
欠陥知識循環システム
20日前
株式会社日立製作所
沿岸環境監視システム
1か月前
株式会社日立製作所
計画装置および計画方法
12日前
株式会社日立製作所
受診支援装置および方法
29日前
株式会社日立製作所
訓練システムおよび訓練方法
2日前
株式会社日立製作所
管理システムおよび管理方法
2日前
株式会社日立製作所
対話システムおよび対話方法
29日前
株式会社日立製作所
直動接点および巻線切替装置
28日前
株式会社日立製作所
情報処理装置及び情報処理方法
2日前
株式会社日立製作所
搬送制御装置及び搬送制御方法
29日前
株式会社日立製作所
人物特性推定システム及び方法
21日前
株式会社日立製作所
状態検知装置及び状態検知方法
14日前
株式会社日立製作所
電子機器および電子機器制御方法
14日前
株式会社日立製作所
再エネ調達手段選定支援システム
28日前
株式会社日立製作所
設計支援装置および設計支援方法
1か月前
株式会社日立製作所
情報処理システム、情報処理方法
28日前
株式会社日立製作所
電力変換器およびインバータ装置
2日前
株式会社日立製作所
障害対応システム及び障害対応方法
20日前
株式会社日立製作所
異常検知システム及び異常検知方法
12日前
株式会社日立製作所
情報抽出システム及び情報抽出方法
1か月前
株式会社日立製作所
情報処理システム及び情報処理方法
1か月前
株式会社日立製作所
建物管理システム及び建物管理方法
12日前
株式会社日立製作所
音声分析システム及び音声分析方法
6日前
株式会社日立製作所
計算機システム及びデータ検索方法
2日前
株式会社日立製作所
ワークフロー作成支援装置及び方法
29日前
株式会社日立製作所
昇降機システム及び昇降機制御方法
2日前
株式会社日立製作所
ログ抽出方法及びログ抽出システム
22日前
続きを見る