TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
公開番号
2025096195
公報種別
公開特許公報(A)
公開日
2025-06-26
出願番号
2024213208
出願日
2024-12-06
発明の名称
広告画像を生成する方法、装置及び記憶媒体
出願人
富士通株式会社
代理人
弁理士法人ITOH
主分類
G06Q
30/0241 20230101AFI20250619BHJP(計算;計数)
要約
【課題】本開示は、広告画像を生成する方法、装置及び記憶媒体を提供する。
【解決手段】該方法は、製品の広告画像のテキスト説明に基づいて、AI画像生成モデルのためのテキスト制御パラメータを生成するステップと、前景が製品を示す画像ブロックであり、且つ背景が単一の色である製品画像に基づいて、AI画像生成モデルのための画像空間制御パラメータを生成するステップと、製品画像に基づいて、AI画像生成モデルのためのノイズ画像を生成するステップと、AI画像生成モデルを使用して、テキスト制御パラメータ、画像空間制御パラメータ及びノイズ画像に基づいて、初期製品画像を生成するステップと、初期製品画像における対応する領域を画像ブロックに置き換えることによって、復元製品画像を生成するステップと、復元製品画像に対して前景画像と背景画像とを融合する後処理を実行することによって、製品の広告画像を生成するステップと、を含む。
【選択図】図1
特許請求の範囲
【請求項1】
コンピュータが実行する、広告画像を生成する方法であって、
製品の広告画像のテキスト説明に基づいて、AI画像生成モデルのためのテキスト制御パラメータを生成するステップと、
前景が前記製品を示す画像ブロックであり、且つ背景が単一の色である製品画像に基づいて、前記AI画像生成モデルのための画像空間制御パラメータを生成するステップと、
前記製品画像に基づいて、前記AI画像生成モデルのためのノイズ画像を生成するステップと、
前記AI画像生成モデルを使用して、前記テキスト制御パラメータ、前記画像空間制御パラメータ及び前記ノイズ画像に基づいて、初期製品画像を生成するステップと、
前記初期製品画像における対応する領域を前記画像ブロックに置き換えることによって、復元製品画像を生成するステップと、
前記復元製品画像に対して前景画像と背景画像とを融合する後処理を実行することによって、前記製品の広告画像を生成するステップと、を含む、方法。
続きを表示(約 1,900 文字)
【請求項2】
AI画像生成モデルのためのテキスト制御パラメータを生成するステップは、
言語モデルを使用して前記テキスト説明を生成するステップと、
テキストエンコーダを使用して、前記テキスト説明の特徴ベクトルを前記テキスト制御パラメータとして生成するステップと、を含む、請求項1に記載の方法。
【請求項3】
前記製品画像を生成する際に、
ユーザにより提供された前記製品の元画像を分割することによって、前記元画像における前記製品を示す前景画像を抽出し、
所定の画像サイズに基づいて前記前景画像をスケーリングすることによって、前記製品の画像ブロックを生成し、
前記画像ブロック、前記単一の色及び前記画像ブロックの所定位置に基づいて前記製品画像を生成し、
前記広告画像は、前記所定の画像サイズを有する、請求項1に記載の方法。
【請求項4】
前記AI画像生成モデルのための画像空間制御パラメータを生成するステップは、
前記製品画像に対してエッジ検出を実行することによって、エッジ画像を生成するステップと、
ニューラルネットワークにより前記エッジ画像を符号化することによって、前記製品画像の特徴を前記画像空間制御パラメータとして生成するステップと、を含む、請求項1に記載の方法。
【請求項5】
前記ノイズ画像を生成するステップは、
前記製品画像にノイズを反復的に漸進的に追加することによって、製品ノイズ画像を生成するステップと、
ランダムノイズ画像を生成するステップと、
前記製品画像における前記画像ブロックのカバレッジ領域を示すマスクに基づいて、前記製品ノイズ画像と前記ランダムノイズ画像とを組み合わせて前記ノイズ画像とするステップと、を含む、請求項1に記載の方法。
【請求項6】
復元製品画像を生成するステップは、
前記製品画像における前記画像ブロックのカバレッジ領域を示すマスクに基づいて、前記製品画像と前記初期製品画像とを組み合わせて復元製品画像とするステップ、を含む、請求項1に記載の方法。
【請求項7】
前記AI画像生成モデルは、前記ノイズ画像からノイズを漸進的に除去することによって前記初期製品画像を生成するように構成される、請求項1に記載の方法。
【請求項8】
前記後処理は、
前記復元製品画像と前記画像ブロックとに対してポアソン画像合成を実行することによってポアソン合成画像を取得することと、
前記製品画像における前記画像ブロックの境界に基づいて前記ポアソン合成画像における前記製品の輪郭線の内側の内側領域に対して境界遷移平滑化を実行することによって、第1の平滑化画像を取得することと、
前記第1の平滑化画像における前記製品の輪郭線近傍の輪郭領域に対してガウスフィルタリング平滑化を実行することによって、第2の平滑化画像を前記製品の広告画像として取得することと、を含む、請求項1に記載の方法。
【請求項9】
広告画像を生成する装置であって、
命令が記憶されたメモリと、
請求項1乃至8の何れかに記載の方法を実現するように前記命令を実行するように構成される少なくとも1つのプロセッサと、を含む、装置。
【請求項10】
プログラムが記憶されたコンピュータ読み取り可能な非一時的な記憶媒体であって、前記プログラムがコンピュータにより実行される際に、前記コンピュータに、
製品の広告画像のテキスト説明に基づいて、AI画像生成モデルのためのテキスト制御パラメータを生成するステップと、
前景が前記製品を示す画像ブロックであり、且つ背景が単一の色である製品画像に基づいて、前記AI画像生成モデルのための画像空間制御パラメータを生成するステップと、
前記製品画像に基づいて、前記AI画像生成モデルのためのノイズ画像を生成するステップと、
前記AI画像生成モデルを使用して、前記テキスト制御パラメータ、前記画像空間制御パラメータ及び前記ノイズ画像に基づいて、初期製品画像を生成するステップと、
前記初期製品画像における対応する領域を前記画像ブロックに置き換えることによって、復元製品画像を生成するステップと、
前記復元製品画像に対して前景画像と背景画像とを融合する後処理を実行することによって、前記製品の広告画像を生成するステップと、を実行させる、記憶媒体。
発明の詳細な説明
【技術分野】
【0001】
本開示は、画像処理に関し、具体的には、コンピュータが実行する広告画像を生成する方法、広告画像を生成する装置、及びプログラムが記憶されたコンピュータ読み取り可能な非一時的な記憶媒体に関する。
続きを表示(約 1,900 文字)
【背景技術】
【0002】
コンピュータ科学と人工知能の発展に伴い、コンピュータを使用してニューラルネットワークに基づく人工知能(Artificial Intelligence:AI)モデルを実行することで情報処理を実現することは、益々一般的かつ効果的になっている。画像生成は、人工知能モデルの重要な応用分野の1つである。
【0003】
製品画像を含む製品広告は、対象製品の特徴と効果を示し、製品の宣伝に役立ち、製品の認知度を向上させ、さらに製品の売上と利益を向上させる。従来の広告制作では、製品についての広告画像として、該製品の特徴を示す製品画像を手動で作成する必要があった。従来の広告画像の制作では、大量の労力と時間が必要であった。基本テンプレートに基づいて広告画像を作成しても、依然として大量の労力と時間が必要であった。
【0004】
現在、生成的AIモデルに基づいて画像を生成する方法がある。このようなAIモデルは、創造的な画像を生成することができるが、製品の画像の細部を復元することができない。また、特に珍しい製品の場合、既存のAIモデルは、通常、該製品の製品画像内の製品(製品画像ブロック)と一致する広告画像を生成することができない。
【0005】
製品の高品質な広告画像を生成することが望ましい。
【発明の概要】
【発明が解決しようとする課題】
【0006】
以下は、本開示の態様を基本的に理解させるために、本開示の簡単な概要を説明する。なお、この簡単な概要は、本開示を網羅的な概要ではなく、本開示のポイント又は重要な部分を意図的に特定するものではなく、本開示の範囲を意図的に限定するものではなく、後述するより詳細的な説明の前文として、単なる概念を簡単な形で説明することを目的とする。
【0007】
本発明の発明者は、画像生成モデル及び画像処理技術を研究し、効率及び画像品質の利点を期待する、広告画像を生成するための改善された方法を提案する。
【課題を解決するための手段】
【0008】
本開示の1つの態様では、コンピュータが実行する、広告画像を生成する方法であって、製品の広告画像のテキスト説明に基づいて、AI画像生成モデルのためのテキスト制御パラメータを生成するステップと、前景が前記製品を示す画像ブロックであり、且つ背景が単一の色である製品画像に基づいて、前記AI画像生成モデルのための画像空間制御パラメータを生成するステップと、前記製品画像に基づいて、前記AI画像生成モデルのためのノイズ画像を生成するステップと、前記AI画像生成モデルを使用して、前記テキスト制御パラメータ、前記画像空間制御パラメータ及び前記ノイズ画像に基づいて、初期製品画像を生成するステップと、前記初期製品画像における対応する領域を前記画像ブロックに置き換えることによって、復元製品画像を生成するステップと、前記復元製品画像に対して前景画像と背景画像とを融合する後処理を実行することによって、前記製品の広告画像を生成するステップと、を含む、方法を提供する。
【0009】
本開示の1つの態様では、広告画像を生成する装置であって、命令が記憶されたメモリと、上記の広告画像を生成する方法を実現するように前記命令を実行するように構成される少なくとも1つのプロセッサと、を含む、装置を提供する。
【0010】
本開示のもう1つの態様では、プログラムが記憶されたコンピュータ読み取り可能な非一時的な記憶媒体であって、前記プログラムがコンピュータにより実行される際に、前記コンピュータに、製品の広告画像のテキスト説明に基づいて、AI画像生成モデルのためのテキスト制御パラメータを生成するステップと、前景が前記製品を示す画像ブロックであり、且つ背景が単一の色である製品画像に基づいて、前記AI画像生成モデルのための画像空間制御パラメータを生成するステップと、前記製品画像に基づいて、前記AI画像生成モデルのためのノイズ画像を生成するステップと、前記AI画像生成モデルを使用して、前記テキスト制御パラメータ、前記画像空間制御パラメータ及び前記ノイズ画像に基づいて、初期製品画像を生成するステップと、前記初期製品画像における対応する領域を前記画像ブロックに置き換えることによって、復元製品画像を生成するステップと、前記復元製品画像に対して前景画像と背景画像とを融合する後処理を実行することによって、前記製品の広告画像を生成するステップと、を実行させる、記憶媒体を提供する。
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
富士通株式会社
測定装置
9日前
富士通株式会社
光伝送装置
1か月前
富士通株式会社
画像変換機器と方法
12日前
富士通株式会社
光伝送装置および光伝送方法
17日前
富士通株式会社
光受信装置及び光伝送システム
1か月前
富士通株式会社
制御プログラム、および制御方法
18日前
富士通株式会社
人工知能ベースのサステナブル材料設計
1か月前
富士通株式会社
通信管理装置および無線リソース予測方法
19日前
富士通株式会社
圧縮プログラム、圧縮方法および圧縮装置
9日前
富士通株式会社
管理装置、管理方法および管理プログラム
23日前
富士通株式会社
広告画像を生成する方法、装置及び記憶媒体
2日前
富士通株式会社
赤外線センサ、及び赤外線センサの製造方法
4日前
富士通株式会社
ホモグラフィの取得装置、方法及び電子機器
24日前
富士通株式会社
因果関係分析方法及び因果関係分析プログラム
1か月前
富士通株式会社
プログラム、データ処理方法およびデータ処理装置
1か月前
富士通株式会社
量子ビットデバイス及び量子ビットデバイスの製造方法
2日前
富士通株式会社
レース投票券購入方法及びレース投票券購入プログラム
18日前
富士通株式会社
強化学習プログラム、強化学習方法および情報処理装置
1か月前
富士通株式会社
メモリ駆動装置、光伝送システム、及びメモリ駆動方法
1か月前
富士通株式会社
ログ管理装置、ログ管理方法およびログ管理プログラム
1か月前
富士通株式会社
情報処理プログラム、情報処理方法および情報処理装置
1か月前
富士通株式会社
画像に基づいて視程値を計算する装置、方法及び電子機器
24日前
富士通株式会社
分散シフト・ファイバーに関する前方ラマン・ポンピング
1か月前
富士通株式会社
出力制御プログラム、出力制御方法およびナビゲーション装置
16日前
富士通株式会社
リソース管理装置、リソース管理方法およびリソース管理プログラム
29日前
富士通株式会社
量子回路情報生成プログラム、量子回路情報生成方法、および情報処理装置
22日前
富士通株式会社
機械学習プログラム、機械学習方法、推論プログラム、推論方法及び情報処理装置
9日前
富士通株式会社
交通シミュレーションの進化を予測するための、コンピュータにより実施される方法
11日前
富士通株式会社
依存情報を列に集約したマトリクススケジューラ及びマトリクススケジューリング方法
3日前
富士通株式会社
量子回路シミュレーションプログラム、量子回路シミュレーション方法および情報処理装置
4日前
富士通株式会社
多変量データを予測するようニューラルネットワークをトレーニングする方法およびシステム
24日前
個人
対話装置
16日前
個人
政治のAI化
1か月前
個人
物品給付年金
1か月前
個人
情報処理装置
16日前
個人
記入設定プラグイン
4日前
続きを見る
他の特許を見る