TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025124185
公報種別公開特許公報(A)
公開日2025-08-26
出願番号2024020068
出願日2024-02-14
発明の名称データ生成方法、データ処理装置、および、プログラム
出願人セイコーエプソン株式会社
代理人個人,個人,個人
主分類G06N 20/00 20190101AFI20250819BHJP(計算;計数)
要約【課題】生成モデルによって生成されるデータを、データの独自性に応じて選択するための技術を提供する。
【解決手段】新規データを生成するためのデータ生成方法であって、潜在変数を入力としてデータを生成する生成モデルによって予め生成された基準データの元となる潜在変数である基準潜在変数と、埋め込み空間における基準データの密度と、の対応関係、および、新規データの元となる潜在変数である新規潜在変数を用いて、埋め込み空間における新規データの密度を推定する密度推定工程と、新規潜在変数を、密度推定工程で推定される新規データの密度に応じて評価する評価工程と、を備える。
【選択図】図4
特許請求の範囲【請求項1】
新規データを生成するためのデータ生成方法であって、
潜在変数を入力としてデータを生成する生成モデルによって予め生成された基準データの元となる前記潜在変数である基準潜在変数と、埋め込み空間における前記基準データの密度と、の対応関係、および、前記新規データの元となる前記潜在変数である新規潜在変数を用いて、前記埋め込み空間における前記新規データの密度を推定する密度推定工程と、
前記新規潜在変数を、前記密度推定工程で推定される前記新規データの密度に応じて評価する評価工程と、を備える、データ生成方法。
続きを表示(約 1,200 文字)【請求項2】
請求項1に記載のデータ生成方法であって、
前記評価工程において、前記新規潜在変数を前記新規データの生成に使用するか否かが評価され、
前記評価工程において使用すると評価された場合に、前記生成モデルに前記新規潜在変数を入力して前記新規データを生成する新規データ生成工程をさらに備える、データ生成方法。
【請求項3】
請求項1に記載のデータ生成方法であって、
前記評価工程に先立って、ユーザーから前記評価工程における評価条件の指定を受け付ける受付工程を備える、データ生成方法。
【請求項4】
請求項2に記載のデータ生成方法であって、
前記評価工程において、推定される前記新規潜在変数の密度が第1密度である場合、推定される前記新規潜在変数の密度が前記第1密度より大きい第2密度である場合と比較して、高い確率で、前記新規潜在変数を使用すると評価する、データ生成方法。
【請求項5】
請求項2に記載のデータ生成方法であって、
生成された前記新規データをユーザーに提示する工程を備える、データ生成方法。
【請求項6】
請求項1に記載のデータ生成方法であって、
前記対応関係は、前記基準潜在変数と、正規化された前記基準データの密度と、の対応関係を表す、データ生成方法。
【請求項7】
請求項1に記載のデータ生成方法であって、
前記評価工程における前記新規潜在変数の評価結果をユーザーに提示する工程を備える、データ生成方法。
【請求項8】
請求項1から7のいずれか一項に記載のデータ生成方法であって、
入力されるデータの特徴を前記埋め込み空間へ射影する学習モデルに前記基準データを入力することによって、前記基準データが前記埋め込み空間に射影された基準埋め込みベクトルを生成する基準生成工程と、
前記基準埋め込みベクトルを用いて、前記埋め込み空間における前記基準データの密度を算出する密度算出工程と、
前記基準潜在変数と、前記密度算出工程で算出される前記基準データの密度と、を用いて、前記対応関係を学習した回帰モデルを生成する回帰工程と、を備え、
前記学習モデルは、前記生成モデルによって生成された複数のデータを含む学習用データセットを用いて機械学習させた学習モデルであり、
前記密度推定工程では、前記回帰モデルを用いて、前記新規潜在変数の密度を推定する、データ生成方法。
【請求項9】
請求項8に記載のデータ生成方法であって、
前記学習用データセットは、前記基準データを含む、データ生成方法。
【請求項10】
請求項8に記載のデータ生成方法であって、
前記学習モデルは、自己教師有り学習によって学習済みである、データ生成方法。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本開示は、データ生成方法、データ処理装置、および、プログラムに関する。
続きを表示(約 2,300 文字)【背景技術】
【0002】
特許文献1には、自然物の入力画像と人工物とが掛け合わされた画像を出力するように学習された学習モデルに基づき、入力画像と人工物とが掛け合わされた出力画像を出力する技術が開示されている。
【先行技術文献】
【特許文献】
【0003】
特開2021-168078号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1のように、入力データに基づいてデータを生成する生成モデルによって生成されたデータを出力する技術では、生成モデルによって生成されるデータ同士が類似し、出力されるデータの多様性が所望の多様性より低い場合がある。また、反対に、例えば、多様性のより低いデータを所望する場合には、出力されるデータの多様性が所望の多様性より高い場合もある。したがって、生成モデルによって生成されるデータを、データの独自性に応じて選択するための技術が望まれている。
【課題を解決するための手段】
【0005】
本開示の第1の形態によれば、データ生成方法が提供される。このデータ生成方法は、潜在変数を入力としてデータを生成する生成モデルによって予め生成された基準データの元となる前記潜在変数である基準潜在変数と、埋め込み空間における前記基準データの密度と、の対応関係、および、前記新規データの元となる前記潜在変数である新規潜在変数を用いて、前記埋め込み空間における前記新規データの密度を推定する密度推定工程と、前記新規潜在変数を、前記密度推定工程で推定される前記新規データの密度に応じて評価する評価工程と、を備える。
【0006】
本開示の第2の形態によれば、データ処理装置が提供される。このデータ処理装置は、プロセッサーを備え、前記プロセッサーは、潜在変数を入力としてデータを生成する生成モデルによって予め生成された基準データの元となる前記潜在変数である基準潜在変数と、埋め込み空間における前記基準データの密度と、の対応関係、および、前記新規データの元となる前記潜在変数である新規潜在変数を用いて、前記埋め込み空間における前記新規データの密度を推定する密度推定処理と、前記新規潜在変数を、前記密度推定処理で推定される前記新規データの密度に応じて評価する評価処理と、を実行する。
【0007】
本開示の第3の形態によれば、プログラムが提供される。このプログラムは、潜在変数を入力としてデータを生成する生成モデルによって予め生成された基準データの元となる前記潜在変数である基準潜在変数と、前記基準データの埋め込み空間における密度と、の対応関係、および、前記新規データを生成するための前記潜在変数である新規潜在変数を用いて、前記埋め込み空間における前記新規データの密度を推定する密度推定機能と、前記新規潜在変数を、前記密度推定機能によって推定される前記新規データの密度に応じて評価する機能と、をコンピューターに実現させる。
【図面の簡単な説明】
【0008】
データ処理システムの概略構成を示すブロック図。
学習モデルの学習手法を説明する概念図。
事前処理のフローチャート。
第1実施形態におけるメイン処理のフローチャート。
算出部によって算出された確率密度関数の例を示す説明図。
新規データの例を示す図。
第2実施形態におけるメイン処理のフローチャート。
【発明を実施するための形態】
【0009】
A.第1実施形態:
図1は、第1実施形態におけるデータ処理システム50の概略構成を示すブロック図である。データ処理システム50は、生成モデル170によって新規な生成データを生成するために用いられる。生成データは、例えば、画像データやスペクトルデータや文字列データといった種々のデータである。以下では、新規な生成データのことを、単に、「新規データ」ともいう。新規データは、ユーザーUrによって種々の目的で使用される。例えば、新規データが画像データである場合、新規データは、新規なデザインの着想を得るために使用されてもよい。
【0010】
また、データ処理システム50は、新規データを、新規データの独自性に応じて選択するために用いられる。データの独自性は、そのデータが属するデータ群における、そのデータに類似する他のデータの個数の少なさの度合いを表す。データの独自性は、そのデータが属するデータ群において、予め定められた程度以上にそのデータに類似する他のデータの個数が多いほど高い。一般的に、データ同士が類似するか否かは、データ間の距離や、データ同士の類似度に基づいて対象可能である。この場合、データ間の距離としては、例えば、ユークリッド距離やマンハッタン距離を使用可能である。また、類似度としては、例えば、コサイン類似度や、交差エントロピーに基づく類似度を使用可能である。また、各データの独自性は、各データの多様性と相関する。具体的には、データ群により独自性の高いデータがより多く含まれることは、そのデータ群に含まれる各データの多様性がより高いことを意味する。以下では、各データの多様性がより高いデータ群や、各データの多様性がより高いデータセットのことを、単に、「多様性が高いデータ群」や「多様性が高いデータセット」ともいう。
(【0011】以降は省略されています)

この特許をJ-PlatPat(特許庁公式サイト)で参照する

関連特許

個人
裁判のAI化
1か月前
個人
情報処理システム
1か月前
個人
工程設計支援装置
17日前
個人
フラワーコートA
25日前
個人
検査システム
1か月前
個人
介護情報提供システム
1か月前
個人
設計支援システム
1か月前
個人
設計支援システム
1か月前
個人
携帯情報端末装置
18日前
キヤノン電子株式会社
携帯装置
1か月前
個人
不動産売買システム
2か月前
個人
結婚相手紹介支援システム
14日前
株式会社サタケ
籾摺・調製設備
1か月前
株式会社カクシン
支援装置
1か月前
個人
備蓄品の管理方法
1か月前
個人
パスポートレス入出国システム
3日前
個人
アンケート支援システム
27日前
株式会社アジラ
進入判定装置
3日前
個人
食事受注会計処理システム
4日前
大阪瓦斯株式会社
住宅設備機器
11日前
サクサ株式会社
中継装置
1か月前
キヤノン株式会社
情報処理装置
1か月前
キヤノン株式会社
情報処理装置
1か月前
サクサ株式会社
中継装置
28日前
個人
ジェスチャーパッドのガイド部材
1か月前
東洋電装株式会社
操作装置
1か月前
アスエネ株式会社
排水量管理方法
1か月前
株式会社村田製作所
ラック
13日前
ホシデン株式会社
タッチ入力装置
2か月前
株式会社東芝
電子機器
2か月前
東洋電装株式会社
操作装置
1か月前
株式会社アジラ
移動方向推定装置
26日前
株式会社ワコム
電子消去具
2か月前
株式会社やよい
美容支援システム
7日前
個人
リテールレボリューションAIタグ
24日前
キヤノン電子株式会社
名刺管理システム
1か月前
続きを見る