TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025111698
公報種別公開特許公報(A)
公開日2025-07-30
出願番号2025074452,2021132919
出願日2025-04-28,2021-08-17
発明の名称学習装置、方法およびプログラム、並びに情報処理装置、方法およびプログラム
出願人富士フイルム株式会社
代理人弁理士法人太陽国際特許事務所
主分類G06V 10/82 20220101AFI20250723BHJP(計算;計数)
要約【課題】画像と文とを高精度に対応づけできるようにする学習装置、方法およびプログラム並びに情報処理装置方法およびプログラムを提供する。
【解決手段】医療情報システムにおいて、学習装置7は、第1ニューラルネットワークにより、画像に含まれるオブジェクトについての第1特徴量を導出する第1導出部22と、画像に含まれるオブジェクトに関する記載を含む文を構造化することにより文についての構造化情報を導出する構造化情報導出部23と、第2ニューラルネットワークにより、構造化情報から文についての第2特徴量を導出する第2導出部24と、を備え、画像に含まれるオブジェクトと文に記載されたオブジェクトとが対応する場合には、第1特徴量及び第2特徴量が属する特徴空間において導出される第1特徴量と第2特徴量との距離が小さくなるように第1ニューラルネットワーク及び第2ニューラルネットワークを学習する。
【選択図】図4
特許請求の範囲【請求項1】
少なくとも1つのプロセッサを備え、
前記プロセッサは、
学習装置であって、
第1ニューラルネットワークにより、画像に含まれるオブジェクトについての第1特徴量を導出し、
画像に含まれるオブジェクトに関する記載を含む文を構造化することにより、前記文についての構造化情報を導出し、
第2ニューラルネットワークにより、前記構造化情報から前記文についての第2特徴量を導出し、
前記画像に含まれるオブジェクトと前記文に記載されたオブジェクトとが対応する場合には、前記第1特徴量および前記第2特徴量が属する特徴空間において、前記画像に含まれるオブジェクトと前記文に記載されたオブジェクトとが対応しない場合よりも、導出される前記第1特徴量と前記第2特徴量との距離が小さくなるように前記第1ニューラルネットワークおよび前記第2ニューラルネットワークを学習することにより、画像に含まれるオブジェクトについての特徴量を導出する第1導出モデルおよびオブジェクトに関する記載を含む文についての特徴量を導出する第2導出モデルを構築する学習装置、
によって構築された第1導出モデルにより、対象画像に含まれる1以上のオブジェクトについての第1特徴量を導出し、
オブジェクトに関する記載を含む1以上の対象文を構造化することにより前記対象文についての構造化情報を導出し、
前記学習装置により構築された第2導出モデルにより、前記対象文についての構造化情報から前記対象文についての第2特徴量を導出し、
導出された前記第1特徴量および前記第2特徴量の特徴空間における距離に基づいて前記第2特徴量に対応する前記第1特徴量を特定し、
前記特定された第1特徴量を導出したオブジェクトを前記対象画像において他の領域と区別して表示する情報処理装置。
続きを表示(約 4,200 文字)【請求項2】
少なくとも1つのプロセッサを備え、
前記プロセッサは、
オブジェクトに関する記載を含む対象文の入力を受け付け、
前記対象文を構造化することにより前記対象文についての構造化情報を導出し、
学習装置であって、
第1ニューラルネットワークにより、画像に含まれるオブジェクトについての第1特徴量を導出し、
画像に含まれるオブジェクトに関する記載を含む文を構造化することにより、前記文についての構造化情報を導出し、
第2ニューラルネットワークにより、前記構造化情報から前記文についての第2特徴量を導出し、
前記画像に含まれるオブジェクトと前記文に記載されたオブジェクトとが対応する場合には、前記第1特徴量および前記第2特徴量が属する特徴空間において、前記画像に含まれるオブジェクトと前記文に記載されたオブジェクトとが対応しない場合よりも、導出される前記第1特徴量と前記第2特徴量との距離が小さくなるように前記第1ニューラルネットワークおよび前記第2ニューラルネットワークを学習することにより、画像に含まれるオブジェクトについての特徴量を導出する第1導出モデルおよびオブジェクトに関する記載を含む文についての特徴量を導出する第2導出モデルを構築する学習装置、
によって構築された第2導出モデルにより、前記対象文についての構造化情報から前記入力された対象文についての第2の特徴量を導出し、
前記学習装置により構築された第1導出モデルにより導出された、複数の参照画像のそれぞれに含まれる1以上のオブジェクトについての第1特徴量が前記参照画像のそれぞれと対応づけられたデータベースを参照することにより、前記複数の参照画像についての前記第1特徴量と前記導出された第2特徴量との特徴空間における距離に基づいて前記第2特徴量に対応する少なくとも1つの前記第1特徴量を特定し、
前記特定された第1特徴量と対応づけられた参照画像を特定する情報処理装置。
【請求項3】
前記プロセッサは、前記第1特徴量との対応づけに寄与した固有表現を通知する請求項1または2に記載の情報処理装置。
【請求項4】
学習装置であって、
第1ニューラルネットワークにより、画像に含まれるオブジェクトについての第1特徴量を導出し、
画像に含まれるオブジェクトに関する記載を含む文を構造化することにより、前記文についての構造化情報を導出し、
第2ニューラルネットワークにより、前記構造化情報から前記文についての第2特徴量を導出し、
前記画像に含まれるオブジェクトと前記文に記載されたオブジェクトとが対応する場合には、前記第1特徴量および前記第2特徴量が属する特徴空間において、前記画像に含まれるオブジェクトと前記文に記載されたオブジェクトとが対応しない場合よりも、導出される前記第1特徴量と前記第2特徴量との距離が小さくなるように前記第1ニューラルネットワークおよび前記第2ニューラルネットワークを学習することにより、画像に含まれるオブジェクトについての特徴量を導出する第1導出モデルおよびオブジェクトに関する記載を含む文についての特徴量を導出する第2導出モデルを構築する学習装置、
によって構築された第1導出モデルにより、対象画像に含まれる1以上のオブジェクトについての第1特徴量を導出し、
オブジェクトに関する記載を含む1以上の対象文を構造化することにより前記対象文についての構造化情報を導出し、
前記学習装置により構築された第2導出モデルにより、前記対象文についての構造化情報から前記対象文についての第2特徴量を導出し、
導出された前記第1特徴量および前記第2特徴量の特徴空間における距離に基づいて前記第2特徴量に対応する前記第1特徴量を特定し、
前記特定された第1特徴量を導出したオブジェクトを前記対象画像において他の領域と区別して表示する情報処理方法。
【請求項5】
オブジェクトに関する記載を含む対象文の入力を受け付け、
前記対象文を構造化することにより前記対象文についての構造化情報を導出し、
学習装置であって、
第1ニューラルネットワークにより、画像に含まれるオブジェクトについての第1特徴量を導出し、
画像に含まれるオブジェクトに関する記載を含む文を構造化することにより、前記文についての構造化情報を導出し、
第2ニューラルネットワークにより、前記構造化情報から前記文についての第2特徴量を導出し、
前記画像に含まれるオブジェクトと前記文に記載されたオブジェクトとが対応する場合には、前記第1特徴量および前記第2特徴量が属する特徴空間において、前記画像に含まれるオブジェクトと前記文に記載されたオブジェクトとが対応しない場合よりも、導出される前記第1特徴量と前記第2特徴量との距離が小さくなるように前記第1ニューラルネットワークおよび前記第2ニューラルネットワークを学習することにより、画像に含まれるオブジェクトについての特徴量を導出する第1導出モデルおよびオブジェクトに関する記載を含む文についての特徴量を導出する第2導出モデルを構築する学習装置、
によって構築された第2導出モデルにより、前記対象文についての構造化情報から前記入力された対象文についての第2の特徴量を導出し、
前記学習装置により構築された第1導出モデルにより導出された、複数の参照画像のそれぞれに含まれる1以上のオブジェクトについての第1特徴量が前記参照画像のそれぞれと対応づけられたデータベースを参照することにより、前記複数の参照画像についての前記第1特徴量と前記導出された第2特徴量との特徴空間における距離に基づいて前記第2特徴量に対応する少なくとも1つの前記第1特徴量を特定し、
前記特定された第1特徴量と対応づけられた参照画像を特定する情報処理方法。
【請求項6】
学習装置であって、
第1ニューラルネットワークにより、画像に含まれるオブジェクトについての第1特徴量を導出し、
画像に含まれるオブジェクトに関する記載を含む文を構造化することにより、前記文についての構造化情報を導出し、
第2ニューラルネットワークにより、前記構造化情報から前記文についての第2特徴量を導出し、
前記画像に含まれるオブジェクトと前記文に記載されたオブジェクトとが対応する場合には、前記第1特徴量および前記第2特徴量が属する特徴空間において、前記画像に含まれるオブジェクトと前記文に記載されたオブジェクトとが対応しない場合よりも、導出される前記第1特徴量と前記第2特徴量との距離が小さくなるように前記第1ニューラルネットワークおよび前記第2ニューラルネットワークを学習することにより、画像に含まれるオブジェクトについての特徴量を導出する第1導出モデルおよびオブジェクトに関する記載を含む文についての特徴量を導出する第2導出モデルを構築する学習装置、
によって構築された第1導出モデルにより、対象画像に含まれる1以上のオブジェクトについての第1特徴量を導出する手順と、
オブジェクトに関する記載を含む1以上の対象文を構造化することにより前記対象文についての構造化情報を導出する手順と、
前記学習装置により構築された第2導出モデルにより、前記対象文についての構造化情報から前記対象文についての第2特徴量を導出する手順と、
導出された前記第1特徴量および前記第2特徴量の特徴空間における距離に基づいて前記第2特徴量に対応する前記第1特徴量を特定する手順と、
前記特定された第1特徴量を導出したオブジェクトを前記対象画像において他の領域と区別して表示する手順とをコンピュータに実行させる情報処理プログラム。
【請求項7】
オブジェクトに関する記載を含む対象文の入力を受け付ける手順と、
前記対象文を構造化することにより前記対象文についての構造化情報を導出する手順と、
学習装置であって、
第1ニューラルネットワークにより、画像に含まれるオブジェクトについての第1特徴量を導出し、
画像に含まれるオブジェクトに関する記載を含む文を構造化することにより、前記文についての構造化情報を導出し、
第2ニューラルネットワークにより、前記構造化情報から前記文についての第2特徴量を導出し、
前記画像に含まれるオブジェクトと前記文に記載されたオブジェクトとが対応する場合には、前記第1特徴量および前記第2特徴量が属する特徴空間において、前記画像に含まれるオブジェクトと前記文に記載されたオブジェクトとが対応しない場合よりも、導出される前記第1特徴量と前記第2特徴量との距離が小さくなるように前記第1ニューラルネットワークおよび前記第2ニューラルネットワークを学習することにより、画像に含まれるオブジェクトについての特徴量を導出する第1導出モデルおよびオブジェクトに関する記載を含む文についての特徴量を導出する第2導出モデルを構築する学習装置、
によって構築された第2導出モデルにより、前記対象文についての構造化情報から前記入力された対象文についての第2の特徴量を導出する手順と、
前記学習装置により構築された第1導出モデルにより導出された、複数の参照画像のそれぞれに含まれる1以上のオブジェクトについての第1特徴量が前記参照画像のそれぞれと対応づけられたデータベースを参照することにより、前記複数の参照画像についての前記第1特徴量と前記導出された第2特徴量との特徴空間における距離に基づいて前記第2特徴量に対応する少なくとも1つの前記第1特徴量を特定する手順と、
前記特定された第1特徴量と対応づけられた参照画像を特定する手順とをコンピュータに実行させる情報処理プログラム。

発明の詳細な説明【技術分野】
【0001】
本開示は、学習装置、方法およびプログラム、並びに情報処理装置、方法およびプログラムに関する。
続きを表示(約 1,700 文字)【背景技術】
【0002】
ディープラーニング等により機械学習がなされた学習済みモデルを用いて画像から抽出した特徴ベクトルのような特徴量が属する特徴空間を構築する手法が提案されている。例えば非特許文献1には、画像およびテキストのそれぞれから特徴量を抽出し、特徴量に基づいて画像とテキストとの関係性を推定する手法が提案されている。
【0003】
また、テキストデータを解析して単語データを取得し、単語データに基づいて画像中の物体を特定する手法も提案されている(特許文献1参照)。
【先行技術文献】
【特許文献】
【0004】
特開2020-013594号公報
【非特許文献】
【0005】
Stacked Cross Attention for Image-Text Matching、Kuang-Huei Leeら、21 Mar 2018、arXiv:1803.08024
【発明の概要】
【発明が解決しようとする課題】
【0006】
ところで、画像についてその内容を文として記載した場合、内容は同一であっても記載した人に応じて表現の仕方が異なる。このため、医用画像についての所見文は、同一の所見であっても医師に応じて表現の仕方が異なる。例えば、右肺の区域S6に充実型の結節があり、そのサイズが10mmであり、かつ境界が不明瞭である所見を呈する医用画像についての所見文は、それを記載する医師に応じて、「右肺S6に充実型結節を認める。サイズは10mm。境界はやや不明瞭である。」、「右肺S6に10mm大の充実型結節を認める。辺縁は比較的不明瞭である。」、および「右下葉S6にφ10mmの充実型結節。境界はやや不明瞭。」のように表現の仕方が異なるものとなる。このように、所見文等の文は内容が同一であっても、表現の仕方が異なることからばらつきが非常に多いものとなる。このように多様な表現を有する文から精度よく特徴量を導出できるモデルを構築するためには、大量の教師データが必要となる。
【0007】
しかしながら、文の数は限りがあるため、大量の教師データを用意することが困難である。このため、画像と文とを高精度に対応づけることができる学習済みモデルを構築することは困難である。
【0008】
本開示は上記事情に鑑みなされたものであり、画像と文とを高精度に対応づけできるようにすることを目的とする。
【課題を解決するための手段】
【0009】
本開示による学習装置は、少なくとも1つのプロセッサを備え、
プロセッサは、第1ニューラルネットワークにより、画像に含まれるオブジェクトについての第1特徴量を導出し、
画像に含まれるオブジェクトに関する記載を含む文を構造化することにより、文についての構造化情報を導出し、
第2ニューラルネットワークにより、構造化情報から文についての第2特徴量を導出し、
画像に含まれるオブジェクトと文に記載されたオブジェクトとが対応する場合には、第1特徴量および第2特徴量が属する特徴空間において、画像に含まれるオブジェクトと文に記載されたオブジェクトとが対応しない場合よりも、導出される第1特徴量と第2特徴量との距離が小さくなるように第1ニューラルネットワークおよび第2ニューラルネットワークを学習することにより、画像に含まれるオブジェクトについての特徴量を導出する第1導出モデルおよびオブジェクトに関する記載を含む文についての特徴量を導出する第2導出モデルを構築する。
【0010】
なお、本開示による学習装置においては、プロセッサは、画像に含まれるオブジェクトと文に記載されたオブジェクトとが対応しない場合には、特徴空間において、画像に含まれるオブジェクトと文に記載されたオブジェクトとが対応する場合よりも、導出される第1特徴量と第2特徴量との距離が大きくなるように、第1ニューラルネットワークおよび第2ニューラルネットワークを学習するものであってもよい。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

富士フイルム株式会社
ノズル
23日前
富士フイルム株式会社
医療装置
5日前
富士フイルム株式会社
レンズ装置
1日前
富士フイルム株式会社
レンズ装置
1日前
富士フイルム株式会社
内視鏡処置具
27日前
富士フイルム株式会社
超音波診断装置
28日前
富士フイルム株式会社
超音波プローブ
1日前
富士フイルム株式会社
内視鏡の制御装置
今日
富士フイルム株式会社
ズームレンズおよび撮像装置
1日前
富士フイルム株式会社
画像処理装置及びその作動方法
5日前
富士フイルム株式会社
インストール方法及びプログラム
21日前
富士フイルム株式会社
転写フィルム、積層体の製造方法
21日前
富士フイルム株式会社
加工装置、及び袋状部材の製造方法
28日前
富士フイルム株式会社
医薬品製造用シングルユースバッグ
22日前
富士フイルム株式会社
医用画像撮像装置及びその制御方法
1日前
富士フイルム株式会社
情報処理装置、方法およびプログラム
22日前
富士フイルム株式会社
X線透視装置、および、その制御方法
27日前
富士フイルム株式会社
接合レンズ及び接合レンズの製造方法
5日前
富士フイルム株式会社
受信コイルユニット及び磁気共鳴撮像装置
22日前
富士フイルム株式会社
ヘッドユニット及びインクジェット記録装置
29日前
富士フイルム株式会社
ズームレンズ、投写型表示装置、及び撮像装置
28日前
富士フイルム株式会社
熱伝導シート、積層体の製造方法および積層体
20日前
富士フイルム株式会社
超音波診断装置および超音波診断装置の制御方法
21日前
富士フイルム株式会社
ズームレンズ、投写型表示装置、および撮像装置
28日前
富士フイルム株式会社
超音波診断装置および超音波診断装置の制御方法
21日前
富士フイルム株式会社
ペプチドの製造方法、化合物、及びペプチド合成試薬
今日
富士フイルム株式会社
情報処理装置、情報処理装置の作動方法及びプログラム
27日前
富士フイルム株式会社
化合物
22日前
富士フイルム株式会社
表示方法
20日前
富士フイルム株式会社
超音波断層画像処理装置及び超音波断層画像処理プログラム
28日前
富士フイルム株式会社
受信コイルユニット、医用画像診断システム及びコイルカバー
22日前
富士フイルム株式会社
放射線撮影システム、放射線撮影方法、及び放射線撮影プログラム
27日前
富士フイルム株式会社
放射線撮影システム、放射線撮影方法、及び放射線撮影プログラム
27日前
富士フイルム株式会社
繊維板構造体製造方法、繊維板構造体製造システム、及び繊維板構造体
今日
富士フイルム株式会社
コイルユニット、磁気共鳴イメージング装置及びコイルユニットカバー
22日前
富士フイルム株式会社
撮像レンズおよび撮像装置
1か月前
続きを見る