TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025140802
公報種別
公開特許公報(A)
公開日
2025-09-29
出願番号
2024040386
出願日
2024-03-14
発明の名称
情報処理装置、情報処理方法、及びプログラム
出願人
日本電気株式会社
代理人
個人
主分類
G06T
7/00 20170101AFI20250919BHJP(計算;計数)
要約
【課題】画像中の物体検出を行うための好適なプロンプトを生成する情報処理装置、情報処理方法及びプログラムを提供する。
【解決手段】情報処理装置は、検出対象を指定する入力データを参照して、当該検出対象を視覚的に表現する複数のテキストを含む視覚表現テキスト群を取得するテキスト群取得部と、前記視覚表現テキスト群を参照してプロンプトを生成するプロンプト生成部と、プロンプトと画像とを入力とし、当該プロンプトによって指定される検出対象を当該画像から検出する検出モデルに対して、前記プロンプト生成部が生成したプロンプトを提供する提供部と、を備えている。
【選択図】図1
特許請求の範囲
【請求項1】
検出対象を指定する入力データを参照して、当該検出対象を視覚的に表現する複数のテキストを含む視覚表現テキスト群を取得するテキスト群取得手段と、
前記視覚表現テキスト群を参照してプロンプトを生成するプロンプト生成手段と、
プロンプトと画像とを入力とし、当該プロンプトによって指定される検出対象を当該画像から検出する検出モデルに対して、前記プロンプト生成手段が生成したプロンプトを提供する提供手段と
を備えている情報処理装置。
続きを表示(約 1,700 文字)
【請求項2】
前記プロンプト生成手段によるプロンプト生成処理には、
前記視覚表現テキスト群に含まれる少なくとも何れかのテキストの適切性を評価する評価処理が含まれている
請求項1に記載の情報処理装置。
【請求項3】
前記プロンプト生成手段によるプロンプト生成処理には、
前記プロンプトを生成するために用いる1又は複数のテキストを、前記評価処理の結果を参照して、前記視覚表現テキスト群から選択する選択処理が含まれている
請求項2に記載の情報処理装置。
【請求項4】
前記プロンプト生成手段によるプロンプト生成処理には、
前記選択処理によって選択された1又は複数のテキスト以外のテキストを、前記プロンプトを生成するために用いる更なるテキストとして探索する探索処理が含まれている
請求項3に記載の情報処理装置。
【請求項5】
前記プロンプト生成手段によるプロンプト生成処理には、
前記探索処理によって前記更なるテキストが見出されなかった場合に、前記選択処理によって選択された1又は複数のテキストからプロンプトを生成する処理が含まれる
請求項4に記載の情報処理装置。
【請求項6】
前記テキスト群取得手段によるテキスト群取得処理には、
互いに異なる複数の生成モデルを用いて、複数の前記視覚表現テキスト群を生成する処理が含まれており、
前記評価処理には、
互いに異なる複数の評価モデルを用いて、複数の前記視覚表現テキスト群を評価する処理が含まれている
請求項2から5の何れか1項に記載の情報処理装置。
【請求項7】
前記テキスト群取得処理には、
第1の生成モデルを用いて第1のテキスト群を生成する処理と、
第2の生成モデルを用いて第2のテキスト群を生成する処理と、
前記第1の生成モデルを含む第1の評価モデルを用いて、前記第2のテキスト群を評価する処理と、
前記第2の生成モデルを含む第2の評価モデルを用いて、前記第1のテキスト群を評価する処理と
が含まれている
請求項6に記載の情報処理装置。
【請求項8】
検出対象を指定する入力データを取得する取得手段と、
プロンプトと画像とを入力とし、当該プロンプトによって指定される検出対象を当該画像から検出する検出モデルに対して、前記入力データを参照して得られるプロンプトを提供する提供手段と
を備えており、
前記提供手段が提供するプロンプトは、
前記検出対象を視覚的に表現する複数のテキストを含む視覚表現テキスト群を取得するテキスト群取得処理と、
前記視覚表現テキスト群を参照してプロンプトを生成するプロンプト生成処理と
を含む処理によって生成されたプロンプトである
情報処理装置。
【請求項9】
検出対象を指定する入力データを参照して、当該検出対象を視覚的に表現する複数のテキストを含む視覚表現テキスト群を取得することと、
前記視覚表現テキスト群を参照してプロンプトを生成することと、
プロンプトと画像とを入力とし、当該プロンプトによって指定される検出対象を当該画像から検出する検出モデルに対して、前記生成したプロンプトを提供することと
を含んでいる情報処理方法。
【請求項10】
情報処理装置としてコンピュータを機能させるプログラムであって、
前記コンピュータを、
検出対象を指定する入力データを参照して、当該検出対象を視覚的に表現する複数のテキストを含む視覚表現テキスト群を取得するテキスト群取得手段と、
前記視覚表現テキスト群を参照してプロンプトを生成するプロンプト生成手段と、
プロンプトと画像とを入力とし、当該プロンプトによって指定される検出対象を当該画像から検出する検出モデルに対して、前記プロンプト生成手段が生成したプロンプトを提供する提供手段と
として機能させるプログラム。
発明の詳細な説明
【技術分野】
【0001】
本開示は、情報処理装置、情報処理方法、及びプログラムに関する。
続きを表示(約 1,500 文字)
【背景技術】
【0002】
画像中における物体を認識(検出)する画像認識技術が知られている(例えば特許文献1)。このような技術では、物体に関する認識(検出)を精度よく行うことが求められる。
【先行技術文献】
【特許文献】
【0003】
特開平05-174147号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
一方、近年、画像中の物体と物体を表現するテキストプロンプトとが紐づくように物体検出器を学習させるテキストベースの物体検出技術が知られている。このような技術では、物体検出の精度がプロンプトに依存するため、より好適なプロンプトを生成することが望ましい。しかしながら、好適なプロンプトを生成することはユーザの負担になっていた。
【0005】
本開示は、上記の問題に鑑みてなされたものであり、その一例示的目的は、画像中の物体検出を行うための好適なプロンプトを生成することのできる技術を提供することにある。
【課題を解決するための手段】
【0006】
本開示の一例示的側面に係る情報処理装置は、検出対象を指定する入力データを参照して、当該検出対象を視覚的に表現する複数のテキストを含む視覚表現テキスト群を取得するテキスト群取得手段と、前記視覚表現テキスト群を参照してプロンプトを生成するプロンプト生成手段と、プロンプトと画像とを入力とし、当該プロンプトによって指定される検出対象を当該画像から検出する検出モデルに対して、前記プロンプト生成手段が生成したプロンプトを提供する提供手段と
を備えている。
【0007】
本開示の一例示的側面に係る情報処理装置は、検出対象を指定する入力データを取得する取得手段と、プロンプトと画像とを入力とし、当該プロンプトによって指定される検出対象を当該画像から検出する検出モデルに対して、前記入力データを参照して得られるプロンプトを提供する提供手段とを備えており、前記提供手段が提供するプロンプトは、前記検出対象を視覚的に表現する複数のテキストを含む視覚表現テキスト群を取得するテキスト群取得処理と、前記視覚表現テキスト群を参照してプロンプトを生成するプロンプト生成処理とを含む処理によって生成されたプロンプトである。
【0008】
本開示の一例示的側面に係る情報処理方法は、検出対象を指定する入力データを参照して、当該検出対象を視覚的に表現する複数のテキストを含む視覚表現テキスト群を取得することと、前記視覚表現テキスト群を参照してプロンプトを生成することと、プロンプトと画像とを入力とし、当該プロンプトによって指定される検出対象を当該画像から検出する検出モデルに対して、前記生成したプロンプトを提供することとを含んでいる。
【0009】
なお、各態様に係る情報処理装置は、コンピュータによって実現してもよく、この場合には、コンピュータを前記情報処理装置が備える各手段として動作させることにより前記情報処理装置をコンピュータにて実現させるプログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。
【発明の効果】
【0010】
本開示の一例示的側面によれば、画像中の物体検出を行うための好適なプロンプトを生成することができるという一例示的効果を奏する。
【図面の簡単な説明】
(【0011】以降は省略されています)
この特許をJ-PlatPat(特許庁公式サイト)で参照する
関連特許
日本電気株式会社
分析装置
12日前
日本電気株式会社
光集積回路素子
1日前
日本電気株式会社
レーザモジュール
2日前
日本電気株式会社
超伝導量子回路装置
2日前
日本電気株式会社
受信器および通信装置
3日前
日本電気株式会社
システム、装置及び方法
2日前
日本電気株式会社
量子回路装置と制御方法
12日前
日本電気株式会社
検知装置および検知方法
12日前
日本電気株式会社
通信装置および通信方法
8日前
日本電気株式会社
量子回路装置と制御方法
12日前
日本電気株式会社
送信装置および通信装置
8日前
日本電気株式会社
光伝送システムおよび方法
4日前
日本電気株式会社
分析方法および分析システム
9日前
日本電気株式会社
制御装置、プログラム及び方法
2日前
日本電気株式会社
共振器及びそれを備えた導波回路
10日前
日本電気株式会社
兆候検知装置および兆候検知方法
4日前
日本電気株式会社
演算処理装置および演算処理方法
4日前
日本電気株式会社
システム及びマイグレーション方法
12日前
日本電気株式会社
放送用システムおよび字幕作成方法
4日前
日本電気株式会社
推定装置、推定方法及びプログラム
2日前
日本電気株式会社
処理装置、処理方法、及びプログラム
12日前
日本電気株式会社
推定装置、推定方法、及び、記録媒体
9日前
日本電気株式会社
ソーナー装置、通信方法、プログラム
4日前
日本電気株式会社
画像管理システムおよび画像管理方法
10日前
日本電気株式会社
波長可変レーザ装置及びその構成方法
8日前
日本電気株式会社
情報処理装置、制御方法及び記憶媒体
2日前
日本電気株式会社
通信装置、通信方法及び通信プログラム
9日前
日本電気株式会社
判別装置、判別方法、およびプログラム
4日前
日本電気株式会社
注文端末、注文受付方法及びプログラム
8日前
日本電気株式会社
学習装置、学習方法及び学習プログラム
2日前
日本電気株式会社
情報処理装置、情報処理方法、プログラム
10日前
日本電気株式会社
画像選択装置、画像選択方法及び記憶媒体
10日前
日本電気株式会社
管理装置、管理方法および管理プログラム
10日前
日本電気株式会社
動作認識装置、動作認識方法、プログラム
4日前
日本電気株式会社
性能監視装置、性能監視方法、プログラム
8日前
日本電気株式会社
通信システム、通信方法及び、プログラム
8日前
続きを見る
他の特許を見る