発明の詳細な説明【技術分野】 【0001】 本開示は、学習装置、制御装置、学習方法およびプログラムに関する。 続きを表示(約 1,900 文字)【背景技術】 【0002】 プラントの状態を制御するため、プラントの動作を模擬するモデルを利用する場合がある。この際、モデルが微分可能であると、勾配法に基づくモデル予測制御(Model Predictive Control; MPC)など、勾配法を利用した操作の最適化計算を行うことができる。例えば、非特許文献1に記載の方法では、物理法則やプラントの設計情報などの事前知識を用いて構築されたダイナミックシミュレータを用いることが開示されている。さらに、非特許文献1には、ダイナミックシミュレータを用いてプラントの運転データを収集し、収集したデータを用いて、ニューラルネットワークで表現された常微分方程式モデルを教師あり学習により構築することが開示されている。さらに、非特許文献1には、構築したモデルを用いて勾配法に基づくモデル予測制御を行うことが開示されている。 【0003】 プラントの動作を定量的に表現する常微分方程式などのほかに、非特許文献2に記載のマルチレベルフローモデリング(Multilevel Flow Modeling; MFM)がある。非特許文献2に記載のMFMは、プラントの動作を、プラントを構成する各装置間の接続構造をもとに、ある装置の状態変化が他の装置に波及してゆく関係として定性的に表現する方法である。MFMでは、各装置の機能と目的、および装置間の物質の流れやエネルギーの流れが表現され、ある装置の状態変化が、装置間の流れの構造に従って、他の装置に波及してゆく関係が記述される。 【先行技術文献】 【非特許文献】 【0004】 Kubosawa et.al、 Nonlinear Model Predictive Control using Neural ODE Replicas of Dynamic Simulators、 4th Asia Pacific Conference of the Prognostics and Health Management, Tokyo, Japan, September 11-14, 2023 M. Lind、 An introduction to multilevel flow modeling、 International Electronic Journal of Nuclear Safety and Simulation、 2(1)、 (2011) 【発明の概要】 【発明が解決しようとする課題】 【0005】 モデル対象のシステムから得られたデータを用いる教師あり学習により構築されるモデルは、学習時に経験した状態から離れた状態の再現性が低いという問題がある。 【0006】 本開示の目的の一例は、上述した課題を解決することのできる学習装置、制御装置、学習方法およびプログラムを提供することである。 【課題を解決するための手段】 【0007】 本開示の第1の態様によれば、学習装置は、制御対象システムの機能および構造の情報から予測モデルの構造を決定する手段と、前記予測モデルの学習に用いるための入力値を決定する学習データ入力値決定手段と、前記入力値に対する制御対象システムの出力値と前記予測モデルの出力値との差の大きさが小さくなるよう前記予測モデルのパラメタを更新するモデル学習手段と、を備える。 【0008】 本開示の第2の態様によれば、制御装置は、制御対象システムの機能および構造の情報に基づいて決定された予測モデルを用いて制御対象装置の制御を行う制御手段を備える。 【0009】 本開示の第3の態様によれば、学習方法は、コンピュータが、制御対象システムの機能および構造の情報から予測モデルの構造を決定し、前記予測モデルの学習に用いるための入力値を決定し、前記入力値に対する制御対象システムの出力値と、前記予測モデルの出力値との差の大きさが小さくなるよう前記予測モデルのパラメタを更新する、ことを含む。 【0010】 本開示の第4の態様によれば、プログラムは、コンピュータに、制御対象システムの機能および構造の情報から予測モデルの構造を決定することと、前記予測モデルの学習に用いるための入力値を決定することと、前記入力値に対する制御対象システムの出力値と、前記予測モデルの出力値との差の大きさが小さくなるよう前記予測モデルのパラメタを更新することと、を実行させる。 【発明の効果】 (【0011】以降は省略されています) この特許をJ-PlatPat(特許庁公式サイト)で参照する