TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
公開番号
2025098527
公報種別
公開特許公報(A)
公開日
2025-07-02
出願番号
2023214720
出願日
2023-12-20
発明の名称
キャプション生成装置、キャプション生成方法およびプログラム
出願人
横河電機株式会社
代理人
弁理士法人RYUKA国際特許事務所
主分類
G06V
20/70 20220101AFI20250625BHJP(計算;計数)
要約
【課題】プラント内を撮像した画像から、撮像された対象を説明するキャプションを生成するキャプション生成装置、キャプション生成方法およびプログラムを提供する。
【解決手段】キャプション生成装置100は、プラント内で撮像された画像を取得する画像取得部110と、画像から複数の特徴を抽出する特徴抽出部112と、複数の特徴のそれぞれに対応する画像領域を特定する領域特定部114と、複数の特徴を、画像領域に基づいてグループ化するグループ化部116と、画像に撮像された対象の特徴を表す複数の語を抽出する語抽出部120と、複数のグループのそれぞれについて、グループ内の少なくとも1つの語に基づき、グループに対応する画像範囲内の対象を説明する第1キャプションを生成するキャプション生成部140と、を備える。
【選択図】図3
特許請求の範囲
【請求項1】
プラント内で撮像された画像を取得する画像取得部と、
前記画像から複数の特徴を抽出する特徴抽出部と、
前記複数の特徴のそれぞれに対応する画像領域を特定する領域特定部と、
前記複数の特徴を、前記画像領域に基づいてグループ化するグループ化部と、
前記画像に撮像された対象の特徴を表す複数の語を抽出する語抽出部と、
複数の前記グループのそれぞれについて、前記グループ内の少なくとも1つの前記語に基づき、前記グループに対応する画像範囲内の前記対象の特徴を説明する第1キャプションを生成するキャプション生成部と
を備えるキャプション生成装置。
続きを表示(約 1,900 文字)
【請求項2】
前記キャプション生成部は、前記画像範囲ごとの前記第1キャプションを組み合わせて、前記画像内の前記対象を説明する第2キャプションを生成する、
請求項1に記載のキャプション生成装置。
【請求項3】
前記キャプション生成部は、互いに隣接する複数の前記画像範囲の複数の前記第1キャプションを組み合わせて、前記第2キャプションを複数生成する、
請求項2に記載のキャプション生成装置。
【請求項4】
前記対象の特徴を表す少なくとも1つの前記語と、前記対象の特徴を説明する前記第1キャプションとの関係を学習し、且つ、一の前記画像範囲内の前記対象の特徴を表す語と、他の前記画像範囲内の前記対象の特徴を表す語との間の1つまたは複数の関係のアノテーションによって、複数の前記第1キャプションの組合せと前記第2キャプションとの関係を学習したキャプション生成モデルを記憶するモデル記憶部を更に備え、
前記キャプション生成部は、前記キャプション生成モデルを用いて、新たに入力される前記少なくとも1つの語に基づき前記第1キャプションを生成し、且つ、新たに生成した複数の前記第1キャプションから前記第2キャプションを生成する、
請求項2または3に記載のキャプション生成装置。
【請求項5】
生成した前記第2キャプションの適否をユーザが判断した結果を用いて、前記画像から前記複数の特徴を抽出する特徴抽出モデル、前記画像から前記複数の語を抽出する語抽出モデル、および、前記複数の語から前記第1キャプションを生成し且つ生成した複数の前記第1キャプションから前記第2キャプションを生成するキャプション生成モデルを学習する学習部を更に備え、
前記キャプション生成部は、前記キャプション生成モデルを用いて、新たに入力される前記少なくとも1つの語に基づき前記第1キャプションを生成し、且つ、新たに生成した前記複数の第1キャプションに基づき前記第2キャプションを生成する、
請求項2または3に記載のキャプション生成装置。
【請求項6】
生成した前記第2キャプションに対するユーザの修正入力を用いて、前記画像から前記複数の特徴を抽出する特徴抽出モデル、前記画像から前記複数の語を抽出する語抽出モデル、および、前記複数の語から前記第1キャプションを生成し且つ生成した複数の前記第1キャプションから前記第2キャプションを生成するキャプション生成モデルを学習する学習部を更に備え、
前記キャプション生成部は、前記キャプション生成モデルを用いて、新たに入力される前記少なくとも1つの語に基づき前記第1キャプションを生成し、且つ、新たに生成した前記複数の第1キャプションに基づき前記第2キャプションを生成する、
請求項2または3に記載のキャプション生成装置。
【請求項7】
前記キャプション生成部は、一の前記第1キャプションに対応する一の前記画像範囲内の流体関連の前記対象の特徴を表す語と、他の前記第1キャプションに対応する、前記一の画像範囲に隣接する他の前記画像範囲内の液体または気体を表す語との間の1つまたは複数の関係から、流体関連の前記対象を表す前記語と前記液体または気体を表す前記語との両方を含む前記第2キャプションを生成する、
請求項2または3に記載のキャプション生成装置。
【請求項8】
前記プラント内の事故事例集、事故対応マニュアル、および、メンテナンス履歴の少なくとも何れかに含まれる文を例文として複数記憶する記憶部を更に備え、
前記キャプション生成部は、前記記憶部に記憶された複数の前記例文の中から、抽出された前記複数の語の少なくとも何れかを用いて検索することにより少なくとも1つの前記例文を抽出し、前記少なくとも1つの語および前記抽出した例文に基づき前記第1キャプションを生成し、且つ、新たに生成した複数の前記第1キャプションおよび前記抽出した例文に基づき前記第2キャプションを生成する、
請求項2または3に記載のキャプション生成装置。
【請求項9】
前記キャプション生成部は、前記第2キャプションを複数生成し、抽出した前記例文との類似度を付与する、
請求項8に記載のキャプション生成装置。
【請求項10】
前記第2キャプションは、ユーザが採るべき行動に関する複数の行動オプション、または、前記ユーザに対する指示を含む、
請求項8に記載のキャプション生成装置。
(【請求項11】以降は省略されています)
発明の詳細な説明
【技術分野】
【0001】
本発明は、キャプション生成装置、キャプション生成方法およびプログラムに関する。
続きを表示(約 2,700 文字)
【背景技術】
【0002】
特許文献1には、「GPSにより特定される位置情報を入手し、プラント職員に現在の点検箇所を表示し、備え付けのカメラにより撮影された画像データを…蓄積・解析し、過去の機器状態や異常事例等からプラント機器に異常の兆候があるか判断を行い、同時に予め設定されたフォーマット・文面を使用し、定期点検の報告書を画像データより自動的に作成する」(段落0053)と記載されている。特許文献2には、「前記作業対象のプラント設備機器および当該プラント設備機器の周辺に存在する配管を前記カメラで撮影して得られる画像から、前記配管に関する情報を第1の特徴量として取得する特徴量取得部と、前記第1の特徴量と、設計データから取得される前記配管に関する第2の特徴量とを比較する特徴量比較部と、を備える」(請求項1)と記載されている。特許文献3には、「異常メール作成機能102は、異常監視機能101がプラント異常を検知したときに起動するものであり、異常と検知された日時、該当プラント機器名、異常内容等の監視員に早期に連絡すべき事項を文章化してメール送信文を作成する」(段落0019)と記載されている。
[先行技術文献]
[特許文献]
[特許文献1] 特許第6099989号
[特許文献2] 特許第6826509号
[特許文献3] 特開2003-51895号公報
【発明の概要】
【0003】
本発明の第1の態様においては、キャプション生成装置を提供する。キャプション生成装置は、プラント内で撮像された画像を取得する画像取得部と、前記画像から複数の特徴を抽出する特徴抽出部と、前記複数の特徴のそれぞれに対応する画像領域を特定する領域特定部と、前記複数の特徴を、前記画像領域に基づいてグループ化するグループ化部と、前記画像に撮像された対象の特徴を表す複数の語を抽出する語抽出部と、複数の前記グループのそれぞれについて、前記グループ内の少なくとも1つの前記語に基づき、前記グループに対応する画像範囲内の前記対象の特徴を説明する第1キャプションを生成するキャプション生成部とを備える。
【0004】
上記のキャプション生成装置において、前記キャプション生成部は、前記画像範囲ごとの前記第1キャプションを組み合わせて、前記画像内の前記対象を説明する第2キャプションを生成してもよい。
【0005】
上記の何れかのキャプション生成装置において、前記キャプション生成部は、互いに隣接する複数の前記画像範囲の複数の前記第1キャプションを組み合わせて、前記第2キャプションを複数生成してもよい。
【0006】
上記の何れかのキャプション生成装置は、前記対象の特徴を表す少なくとも1つの前記語と、前記対象の特徴を説明する前記第1キャプションとの関係を学習し、且つ、一の前記画像範囲内の前記対象の特徴を表す語と、他の前記画像範囲内の前記対象の特徴を表す語との間の1つまたは複数の関係のアノテーションによって、複数の前記第1キャプションの組合せと前記第2キャプションとの関係を学習したキャプション生成モデルを記憶するモデル記憶部を更に備えてもよい。上記の何れかのキャプション生成装置において、前記キャプション生成部は、前記キャプション生成モデルを用いて、新たに入力される前記少なくとも1つの語に基づき前記第1キャプションを生成し、且つ、新たに生成した複数の前記第1キャプションから前記第2キャプションを生成してもよい。
【0007】
上記の何れかのキャプション生成装置は、生成した前記第2キャプションの適否をユーザが判断した結果を用いて、前記画像から前記複数の特徴を抽出する特徴抽出モデル、前記画像から前記複数の語を抽出する語抽出モデル、および、前記複数の語から前記第1キャプションを生成し且つ生成した複数の前記第1キャプションから前記第2キャプションを生成するキャプション生成モデルを学習する学習部を更に備えてもよい。上記の何れかのキャプション生成装置において、前記キャプション生成部は、前記キャプション生成モデルを用いて、新たに入力される前記少なくとも1つの語に基づき前記第1キャプションを生成し、且つ、新たに生成した前記複数の第1キャプションに基づき前記第2キャプションを生成してもよい。
【0008】
上記の何れかのキャプション生成装置は、生成した前記第2キャプションに対するユーザの修正入力を用いて、前記画像から前記複数の特徴を抽出する特徴抽出モデル、前記画像から前記複数の語を抽出する語抽出モデル、および、前記複数の語から前記第1キャプションを生成し且つ生成した複数の前記第1キャプションから前記第2キャプションを生成するキャプション生成モデルを学習する学習部を更に備えてもよい。上記の何れかのキャプション生成装置において、前記キャプション生成部は、前記キャプション生成モデルを用いて、新たに入力される前記少なくとも1つの語に基づき前記第1キャプションを生成し、且つ、新たに生成した前記複数の第1キャプションに基づき前記第2キャプションを生成してもよい。
【0009】
上記の何れかのキャプション生成装置において、前記キャプション生成部は、一の前記第1キャプションに対応する一の前記画像範囲内の流体関連の前記対象の特徴を表す語と、他の前記第1キャプションに対応する、前記一の画像範囲に隣接する他の前記画像範囲内の液体または気体を表す語との間の1つまたは複数の関係から、流体関連の前記対象を表す前記語と前記液体または気体を表す前記語との両方を含む前記第2キャプションを生成してもよい。
【0010】
上記の何れかのキャプション生成装置は、前記プラント内の事故事例集、事故対応マニュアル、および、メンテナンス履歴の少なくとも何れかに含まれる文を例文として複数記憶する記憶部を更に備えてもよい。上記の何れかのキャプション生成装置において、前記キャプション生成部は、前記記憶部に記憶された複数の前記例文の中から、抽出された前記複数の語の少なくとも何れかを用いて検索することにより少なくとも1つの前記例文を抽出し、前記少なくとも1つの語および前記抽出した例文に基づき前記第1キャプションを生成し、且つ、新たに生成した複数の前記第1キャプションおよび前記抽出した例文に基づき前記第2キャプションを生成してもよい。
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
横河電機株式会社
プラント運転支援装置
10日前
横河電機株式会社
情報処理装置、評価方法及び評価プログラム
2日前
横河電機株式会社
フィルター吸引ホルダー、核酸抽出システム、及び核酸抽出方法
2日前
横河電機株式会社
キャプション生成装置、キャプション生成方法およびプログラム
3日前
横河電機株式会社
キャプション生成装置、キャプション生成方法およびプログラム
3日前
横河電機株式会社
キャプション生成装置、キャプション生成方法およびプログラム
3日前
横河電機株式会社
キャプション生成装置、キャプション生成方法およびプログラム
3日前
個人
対話装置
23日前
個人
物品給付年金
1か月前
個人
情報処理装置
23日前
個人
政治のAI化
1か月前
個人
情報処理装置
19日前
個人
記入設定プラグイン
11日前
個人
プラグインホームページ
1か月前
個人
情報入力装置
23日前
個人
不動産売買システム
3日前
個人
物価スライド機能付生命保険
23日前
キヤノン株式会社
通信装置
1か月前
個人
マイホーム非電子入札システム
23日前
個人
全アルゴリズム対応型プログラム
1か月前
キヤノン株式会社
画像処理装置
1か月前
株式会社BONNOU
管理装置
16日前
サクサ株式会社
カードの制動構造
25日前
シャープ株式会社
電子機器
1か月前
ホシデン株式会社
タッチ入力装置
3日前
個人
決済手数料0%のクレジットカード
26日前
大同特殊鋼株式会社
輝線検出方法
1か月前
株式会社東芝
電子機器
4日前
株式会社ワコム
電子消去具
3日前
ミサワホーム株式会社
宅配ロッカー
1か月前
株式会社ライト
情報処理装置
16日前
株式会社アジラ
データ転送システム
1か月前
村田機械株式会社
割当補助システム
29日前
ミサワホーム株式会社
情報処理装置
1か月前
トヨタ自動車株式会社
情報処理装置
29日前
パテントフレア株式会社
交差型バーコード
1か月前
続きを見る
他の特許を見る