TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025121515
公報種別
公開特許公報(A)
公開日
2025-08-20
出願番号
2024016946
出願日
2024-02-07
発明の名称
修辞構造解析装置、修辞構造解析方法及びプログラム
出願人
NTT株式会社
,
国立大学法人東京科学大学
代理人
弁理士法人ITOH
,
個人
,
個人
,
個人
主分類
G06F
40/35 20200101AFI20250813BHJP(計算;計数)
要約
【課題】修辞構造解析の性能を向上させること。
【解決手段】修辞構造解析装置は、入力された文書を修辞構造解析するためのプロンプトを生成し、前記プロンプトをLLMに入力するように構成されている問い合わせ部と、前記LLMからの出力に基づいて修辞構造木を構築するように構成されている修辞構造木構築部と、を有する。
【選択図】図4
特許請求の範囲
【請求項1】
入力された文書を修辞構造解析するためのプロンプトを生成し、前記プロンプトをLLMに入力するように構成されている問い合わせ部と、
前記LLMからの出力に基づいて修辞構造木を構築するように構成されている修辞構造木構築部と、
を有することを特徴とする修辞構造解析装置。
続きを表示(約 990 文字)
【請求項2】
前記問い合わせ部は、前記文書を形成するテキストユニットの系列の前記テキストユニットに対応する要素又は前記テキストユニットに基づく木構造に対応する要素を修辞構造解析のために格納するデータ構造に対する操作を問い合わせるための第1のプロンプト、前記データ構造において前記操作の対象とされる要素の核性を問い合わせるための第2のプロンプト、又は前記データ構造において前記核性に係る要素の談話関係を問い合わせるための第3のプロンプトを生成するように構成されており、
前記修辞構造木構築部は、前記第1のプロンプトを入力したLLMからの出力に応じた操作を前記データ構造に対して実行し、前記第2のプロンプトを入力したLLMから出力される核性と、前記第3のプロンプトを入力したLLMから出力される談話関係を前記修辞構造木へ与えるように構成されている、
ことを特徴とする請求項1記載の修辞構造解析装置。
【請求項3】
前記データ構造は、シフト還元法によって修辞構造解析するためのキュー及びスタックであり、
前記問い合わせ部は、前記キュー及びスタックに基づいて前記第1のプロンプトを生成し、当該第1のプロンプトを入力したLLMから出力される操作が還元を示す場合に、当該還元が実行される直前の前記スタックに基づいて前記第2のプロンプトを生成し、当該第2のプロンプトを入力したLLMから出力される核性と、当該還元が実行される直前の前記スタックに基づいて前記第3のプロンプトを生成するように構成されている、
ことを特徴とする請求項2記載の修辞構造解析装置。
【請求項4】
入力された文書を修辞構造解析するためのプロンプトを生成し、前記プロンプトをLLMに入力する問い合わせ手順と、
前記LLMからの出力に基づいて修辞構造木を構築する修辞構造木構築手順と、
をコンピュータが実行することを特徴とする修辞構造解析方法。
【請求項5】
入力された文書を修辞構造解析するためのプロンプトを生成し、前記プロンプトをLLMに入力する問い合わせ手順と、
前記LLMからの出力に基づいて修辞構造木を構築する修辞構造木構築手順と、
をコンピュータに実行させることを特徴とするプログラム。
発明の詳細な説明
【技術分野】
【0001】
本発明は、修辞構造解析装置、修辞構造解析方法及びプログラムに関する。
続きを表示(約 2,400 文字)
【背景技術】
【0002】
[修辞構造木]
修辞構造解析では、文書をEDU(Elementary Discourse Unit)と呼ばれる文よりも小さい、節に相当するテキストユニットの系列データとみなし、これらを終端ノードがあらわし、EDUが形成するスパンの関係を非終端ノードがあらわす再帰構造を持った修辞構造木として表現する(図1参照)。図1においてEDUであるe1~e6(RST Discourse Treebank,WSJ 1100より)の内容は以下の通りである。
e1:[Westinghouse Electric Corp. said]
e2:[it will buy Shaw-Walker Co.]
e3:[Terms weren't disclosed.]
e4:[Shaw-Walker,]
e5:[based in Muskegon, Mich.,]
e6:[makes metal files and desks, and seating and office systems furniture.]
なお、本来、木は多分木として表されるが等価な完全2文木として表現可能である。図1において、終端ノードはEDU(e)であり、非終端ノードはそれが支配する左右のスパンの核性、つまり核(N)であるか衛星(S)であるかを表す。N-Sであれば、左のスパンがN、右のスパンがSとなる。S-Nであれば、右のスパンがN、左のスパンがSとなる。N-S、S-Nの場合にはSからNへの談話関係ラベルが与えられ、N-Nの場合には2つのスパンの間の並列関係をあらわす等価な談話関係ラベルが与えられる。図1の例では、e1はe2の衛星であり、それらの間の談話関係ラベルはAttributionである。また、e3は、e1とe2からなるスパンの衛星であり、それらの間の談話関係ラベルはElaborationである。
【0003】
[修辞構造解析]
文書、つまりEDUの系列が与えられた際に修辞木構造を推定する技術は、現在ではニューラルネットワークを用いて実現される。エンコーダのみの事前学習済み言語モデルを用いてスパンのベクトルを得たのち、(1)木構造推定(スパンの結合もしくは分割の決定)、(2)核性推定(N-S、S-N、N-Nのいずれかを選択)、(3)関係ラベル推定をニューラルネットワークにより実現する。
【0004】
つまり、テキストスパン(EDU系列)をベクトルへと変換する特徴抽出部と、特徴抽出部が出力したベクトルを受け取り、木構造推定、核性推定、談話関係ラベル推定を行う分類部からなる(図2参照)。図2において、FFN
act
が木構造推定、FFN
nuc
が核性推定、FFN
rel
が談話関係ラベルを担う。
【0005】
図2はシフト還元法による修辞構造解析法を示している。シフト還元法では、スタックとキューを用いて、以下のシフト、還元操作(アクション)を繰り返して木を構築する。
シフト:与えられたEDU系列を格納したキューの先頭のEDUをスタックに積む。
還元:スタックの上2つの要素(単一EDUあるいは木)を結合し、(2つの要素を兄弟とする)木を作りスタックの上に積む。
【0006】
なお、還元時に核性、談話関係ラベルも推定する。
【先行技術文献】
【非特許文献】
【0007】
Naoki Kobayashi and Tsutomu Hirao and Hidetaka Kamigaito and Manabu Okumura and Masaaki Nagata、"A Simple and Strong Baseline for End-to-End Neural RST-style Discourse Parsing"、Findings of the Association for Computational Linguistics: EMNLP 2022, pages 6754 - 6766 December
【発明の概要】
【発明が解決しようとする課題】
【0008】
現在の事前学習済み言語モデルの開発は、エンコーダのみのものからデコーダのみのものへと焦点が移っており、大規模化が加速している。多くのエンコーダのみの事前学習済み言語モデルのパラメータ数は数百万程度であることに対し、デコーダのみの事前学習済み大規模言語モデル(以下、「LLM」という。)のパラメータ数は数十億を超えることが多く、数百億を超えるものもある。一般的に、事前学習モデルを用いて自然言語処理のタスクを解く場合、パラメータ数が多い方が良い性能を期待できる。しかし、エンコーダのみの事前学習済み言語モデルとLLMは仕組みに大きな違いがあり、既存の修辞構造解析技術における特徴抽出部の事前学習済み言語モデルをLLMに置き換えるだけでは十分な性能を得ることができない。
【0009】
本発明は、上記の点に鑑みてなされたものであって、修辞構造解析の性能を向上させることを目的とする。
【課題を解決するための手段】
【0010】
そこで上記課題を解決するため、修辞構造解析装置は、入力された文書を修辞構造解析するためのプロンプトを生成し、前記プロンプトをLLMに入力するように構成されている問い合わせ部と、前記LLMからの出力に基づいて修辞構造木を構築するように構成されている修辞構造木構築部と、を有する。
【発明の効果】
(【0011】以降は省略されています)
この特許をJ-PlatPat(特許庁公式サイト)で参照する
関連特許
個人
裁判のAI化
1か月前
個人
フラワーコートA
18日前
個人
情報処理システム
1か月前
個人
工程設計支援装置
10日前
個人
検査システム
1か月前
個人
介護情報提供システム
25日前
個人
設計支援システム
1か月前
個人
携帯情報端末装置
11日前
個人
設計支援システム
1か月前
キヤノン電子株式会社
携帯装置
1か月前
個人
不動産売買システム
1か月前
個人
結婚相手紹介支援システム
7日前
株式会社サタケ
籾摺・調製設備
1か月前
株式会社カクシン
支援装置
1か月前
個人
備蓄品の管理方法
1か月前
個人
アンケート支援システム
20日前
キヤノン株式会社
情報処理装置
1か月前
サクサ株式会社
中継装置
1か月前
サクサ株式会社
中継装置
21日前
キヤノン株式会社
情報処理装置
1か月前
個人
ジェスチャーパッドのガイド部材
24日前
大阪瓦斯株式会社
住宅設備機器
4日前
株式会社ワコム
電子消去具
1か月前
株式会社村田製作所
ラック
6日前
東洋電装株式会社
操作装置
1か月前
株式会社やよい
美容支援システム
今日
キヤノン電子株式会社
名刺管理システム
1か月前
個人
リテールレボリューションAIタグ
17日前
株式会社東芝
電子機器
1か月前
ホシデン株式会社
タッチ入力装置
1か月前
東洋電装株式会社
操作装置
1か月前
株式会社寺岡精工
システム
24日前
アスエネ株式会社
排水量管理方法
1か月前
株式会社アジラ
移動方向推定装置
19日前
キヤノン株式会社
画像形成システム
4日前
株式会社アザース
企業連携システム
25日前
続きを見る
他の特許を見る