TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025112453
公報種別公開特許公報(A)
公開日2025-08-01
出願番号2024006677
出願日2024-01-19
発明の名称行動決定装置、行動決定方法、および行動決定プログラム
出願人株式会社日立製作所
代理人藤央弁理士法人
主分類G06Q 10/101 20230101AFI20250725BHJP(計算;計数)
要約【課題】合意形成の効率化を図ること。
【解決手段】行動決定装置は、言語モデルに基づいて進行役を模擬する第1エージェントと、言語モデルに基づいて参加者を模擬する第2エージェントと、の間の模擬会話を実行することで、模擬会話の開始から終了に至るまでの複数通りの模擬会話経路を探索する探索処理と、第2エージェントにおける参加者の参加者集団に対する集団認知を示す内面状態に基づいて、複数通りの模擬会話経路において第2エージェントから生成される模擬会話での模擬応答文の発話を評価する評価値を算出する算出処理と、評価値に基づいて、模擬会話の開始時点における複数通りの模擬発話候補文の中から特定の模擬発話候補文を抽出する抽出処理と、特定の模擬発話候補文を出力する出力処理と、を実行する。
【選択図】図1
特許請求の範囲【請求項1】
プログラムを実行するプロセッサと、前記プログラムを記憶する記憶デバイスと、を有する行動決定装置であって、
前記プロセッサは、
言語モデルに基づいて参加者集団内の会話での合意形成を支援する進行役を模擬する第1エージェントと、前記言語モデルに基づいて前記会話に参加する参加者を模擬する第2エージェントと、の間の模擬会話を実行することで、前記模擬会話の開始から終了に至るまでの複数通りの模擬会話経路を探索する探索処理と、
前記第2エージェントにおける前記参加者の前記参加者集団に対する集団認知を示す内面状態に基づいて、前記探索処理によって探索された前記複数通りの模擬会話経路において前記第2エージェントから生成される前記模擬会話での模擬応答文の発話を評価する評価値を算出する算出処理と、
前記算出処理によって算出された評価値に基づいて、前記模擬会話の開始時点における前記第1エージェントから前記第2エージェントへの複数通りの模擬発話候補文の中から特定の模擬発話候補文を抽出する抽出処理と、
前記抽出処理によって抽出された前記特定の模擬発話候補文を出力する出力処理と、
を実行することを特徴とする行動決定装置。
続きを表示(約 1,900 文字)【請求項2】
請求項1に記載の行動決定装置であって、
前記探索処理では、前記プロセッサは、前記模擬会話として、前記会話の合意形成を支援する合意支援文を前記第1エージェントに入力して複数通りの模擬発話候補文を生成する第1生成と、前記模擬発話候補文を前記第2エージェントに入力して前記模擬発話候補文に対する模擬応答文を前記合意支援文として生成する第2生成と、を繰り返し実行する、
ことを特徴とする行動決定装置。
【請求項3】
請求項2に記載の行動決定装置であって、
前記記憶デバイスは、前記言語モデルと、人物の特徴を示す人物情報と、を記憶しており、
前記プロセッサは、
前記言語モデルおよび人物情報に基づいて、前記第1エージェントおよび第2エージェントを生成する生成処理を実行し、
前記探索処理では、前記プロセッサは、前記生成処理によって生成された前記第1エージェントと前記第2エージェントと、の間の前記模擬会話として、前記第1生成と前記第2生成とを繰り返し実行することで、前記複数通りの模擬会話経路を探索する、
ことを特徴とする行動決定装置。
【請求項4】
請求項2に記載の行動決定装置であって、
前記行動決定装置と通信可能な前記言語モデルを記憶する外部装置にアクセス可能であり、
前記記憶デバイスは、人物の特徴を示す人物情報と、を記憶しており、
前記プロセッサは、
前記人物情報を含む前記第1エージェントおよび前記第2エージェントの生成要求を前記外部装置に送信して、前記人物情報に基づいて前記外部装置に前記第1エージェントおよび前記第2エージェントを生成させるエージェント生成処理を実行し、
前記探索処理では、前記プロセッサは、前記エージェント生成処理によって生成された前記第1エージェントと前記第2エージェントとの間の前記模擬会話として、前記第1生成と前記第2生成とを繰り返し実行することで、前記複数通りの模擬会話経路を探索する、
ことを特徴とする行動決定装置。
【請求項5】
請求項2に記載の行動決定装置であって、
前記探索処理では、前記プロセッサは、前記模擬発話候補文の入力先となる前記第2エージェントを、前記第2エージェントどうしの前記内面状態のベクトル間距離に基づいて決定し、前記模擬発話候補文を決定した前記第2エージェントに入力して前記模擬応答文を前記合意支援文として生成する、
ことを特徴とする行動決定装置。
【請求項6】
請求項2に記載の行動決定装置であって、
前記探索処理では、前記プロセッサは、前記模擬発話候補文の入力先となる前記第2エージェントを、前記第1エージェントの前記内面状態と前記第2エージェントの前記内面状態とのベクトル間距離に基づいて決定し、前記模擬発話候補文を決定した前記第2エージェントに入力して前記模擬応答文を前記合意支援文として生成する、
ことを特徴とする行動決定装置。
【請求項7】
請求項1に記載の行動決定装置であって、
前記プロセッサは、
自由エネルギー原理における、前記参加者の集団認知に関する自由エネルギーを統合した統合自由エネルギーに基づいて、前記評価値を算出する、
ことを特徴とする行動決定装置。
【請求項8】
請求項1に記載の行動決定装置であって、
前記算出処理では、前記プロセッサは、前記第2エージェントどうしの前記内面状態のベクトル間距離の総和に基づいて、前記評価値を算出する、
ことを特徴とする行動決定装置。
【請求項9】
請求項1に記載の行動決定装置であって、
前記算出処理では、前記プロセッサは、前記第2エージェントの各々について、前記模擬会話の進行方向における前記内面状態のベクトル間距離の総和に基づいて、前記評価値を算出する、
ことを特徴とする行動決定装置。
【請求項10】
請求項2に記載の行動決定装置であって、
前記記憶デバイスは、対話目標と、前記対話目標に対するスコアと、を対応付けた対話目標情報を記憶し、
前記算出処理では、前記プロセッサは、前記対話目標と前記第2生成で生成される前記模擬応答文とのベクトル間距離と、前記スコアと、に基づいて、前記評価値を調整する、
ことを特徴とする行動決定装置。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本発明は、行動を決定する行動決定装置、行動決定方法、および行動決定プログラムに関する。
続きを表示(約 2,700 文字)【背景技術】
【0002】
下記非特許文献1は、ダイナミックな議論プロセスをマルコフ意思決定プロセス(Markov Decision Process;MDP)としてモデル化し、複数ラウンドの議論に最適なファシリテーション方針を学習するために設計された2層のファシリテーションエージェントを開示する。
【先行技術文献】
【非特許文献】
【0003】
Shiyao Ding and Takayuki Ito, A Deep Reinforcement Learning Based Facilitation Agent for Consensus Building among Multi-Round Discussions, ThL20th Pacific International Conference on Artificial Intelligence (PRICAI 2023), November 17-19, 2023, Jakarta, Indonesia.
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、上述した従来技術では、ファシリテーションエージェントが会話を支援する発話を強化学習により学習するため、実行時に大量のファシリテーション行動データを学習データとして収集し、学習することを必要とし、効率的な合意形成については、考慮されていない。
【課題を解決するための手段】
【0005】
本願において開示される発明の一側面となる行動決定装置は、プログラムを実行するプロセッサと、前記プログラムを記憶する記憶デバイスと、を有する行動決定装置であって、前記プロセッサは、言語モデルに基づいて参加者集団内の会話での合意形成を支援する進行役を模擬する第1エージェントと、前記言語モデルに基づいて前記会話に参加する参加者を模擬する第2エージェントと、の間の模擬会話を実行することで、前記模擬会話の開始から終了に至るまでの複数通りの模擬会話経路を探索する探索処理と、前記第2エージェントにおける前記参加者の前記参加者集団に対する集団認知を示す内面状態に基づいて、前記探索処理によって探索された前記複数通りの模擬会話経路において前記第2エージェントから生成される前記模擬会話での模擬応答文の発話を評価する評価値を算出する算出処理と、前記算出処理によって算出された評価値に基づいて、前記模擬会話の開始時点における前記第1エージェントから前記第2エージェントへの複数通りの模擬発話候補文の中から特定の模擬発話候補文を抽出する抽出処理と、前記抽出処理によって抽出された前記特定の模擬発話候補文を出力する出力処理と、を実行することを特徴とする。
【発明の効果】
【0006】
本発明の代表的な実施の形態によれば、合意形成の効率化を図ることができる。前述した以外の課題、構成及び効果は、以下の実施例の説明により明らかにされる。
【図面の簡単な説明】
【0007】
図1は、行動決定システムのシステム構成例1を示す説明図である。
図2は、コンピュータのハードウェア構成例を示すブロック図である。
図3は、人物情報テーブルの一例を示す説明図である。
図4は、話題情報テーブルの一例を示す説明図である。
図5は、対話目標情報テーブルの一例を示す説明図である。
図6は、探索制御情報テーブルの一例を示す説明図である。
図7は、行動決定装置による行動決定処理手順例を示すフローチャートである。
図8は、ステップS702で生成されたファシリテータエージェントの内部モデルの一例を示す説明図である。
図9は、ステップS702で生成された参加者エージェントの内部モデルの一例を示す説明図である。
図10は、発話情報探索処理(ステップS703)の詳細な処理手順例を示すフローチャートである。
図11は、探索木の一例を示す説明図である。
図12は、内面状態のグラフ例1を示す説明図である。
図13は、内面状態のグラフ例2を示す説明図である。
図14は、ファシリテータエージェントの発話結果文の画面表示例1を示す説明図である。
図15は、ファシリテータエージェントの発話結果文の画面表示例2を示す説明図である。
図16は、行動決定システムのシステム構成例2を示す説明図である。
図17は、行動決定システムのシステム構成例3を示す説明図である。
【発明を実施するための形態】
【0008】
以下に示す各実施例では、大規模言語モデル(Large Language Model;LLM)を活用し、人と人の関係性や合意形成を支援する行動決定システムを提供する。行動決定システムには、特に、人と人の「対立」が問題になり得るシーンにおいて、対立を緩和するエージェントが組み込まれる。具体的には、たとえば、行動決定システムは、自由エネルギー原理および能動推論への集団認知モデルの組込みと、LLMへの能動推論組込みによるエージェント化(自律化)と、により実現される。
【0009】
行動決定システムの応用シーンとしては、
1.会議ファシリテーション(複数の参加者間での合意形成を促進)
2.Social Networking Service(SNS)またはオンライン掲示板の管理(暴力的投稿など、参加者間の不適切な相互作用を抑制)
がある。以下、各実施例で詳細に説明する。
【実施例】
【0010】
<システム構成例>
図1は、行動決定システムのシステム構成例1を示す説明図である。行動決定システム100は、サーバとなる行動決定装置101と、1台以上(図1では、例として4台)の端末102と、を有する。行動決定装置101および端末102は、インターネット、LAN(Local Area Network)、WAN(Wide Area Network)などのネットワーク103により通信可能に接続される。また、外部装置104も、ネットワーク103を介して行動決定装置101および端末102と通信可能に接続される。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

株式会社日立製作所
蓄電装置
2日前
株式会社日立製作所
制御基板
4日前
株式会社日立製作所
回転電機
17日前
株式会社日立製作所
エレベーター
11日前
株式会社日立製作所
エレベーター
2日前
株式会社日立製作所
コントローラー
25日前
株式会社日立製作所
回転子および回転電機
27日前
株式会社日立製作所
巻上機及びエレベーター
4日前
株式会社日立製作所
分析システム及び分析方法
11日前
株式会社日立製作所
現新比較テスト支援システム
3日前
株式会社日立製作所
エレベーター及び保護カバー
9日前
株式会社日立製作所
療養指導支援装置および方法
2日前
株式会社日立製作所
接点浄化装置及び風力発電装置
3日前
株式会社日立製作所
めっき装置及びめっき形成方法
17日前
株式会社日立製作所
釣合いおもり及びエレベーター
5日前
株式会社日立製作所
情報提供装置及び情報提供方法
27日前
株式会社日立製作所
生産計画立案支援装置及び方法
27日前
株式会社日立製作所
振動解析装置および振動解析方法
1か月前
株式会社日立製作所
電力融通システム、電力システム
3日前
株式会社日立製作所
情報処理装置および情報処理方法
2日前
株式会社日立製作所
補修指示装置および補修指示方法
10日前
株式会社日立製作所
脱レール検出装置及びエレベーター
1か月前
株式会社日立製作所
計算機システム及びデータ抽出方法
27日前
株式会社日立製作所
水素の混焼を制御する装置および方法
10日前
株式会社日立製作所
ラベル付与装置およびラベル付与方法
2日前
株式会社日立製作所
可搬記憶機器および情報処理システム
3日前
株式会社日立製作所
巻線切替回転電機および電動システム
27日前
株式会社日立製作所
業務支援システム、及び業務支援方法
6日前
株式会社日立製作所
電力系統制御装置及び電力系統制御方法
9日前
株式会社日立製作所
判定システム、判定装置、及び判定方法
17日前
株式会社日立製作所
保守最適化システムおよび保守最適化装置
25日前
株式会社日立製作所
支援装置、支援方法、及び支援プログラム
11日前
株式会社日立製作所
運転計画支援装置、及び運転計画支援方法
1か月前
株式会社日立製作所
放射線治療支援装置及び放射線治療支援方法
4日前
株式会社日立製作所
ポリシー作成システム及びポリシー作成方法
4日前
株式会社日立製作所
ビル清掃管理システム及びビル清掃管理方法
10日前
続きを見る