TOP特許意匠商標
特許ウォッチ Twitter
公開番号2025113637
公報種別公開特許公報(A)
公開日2025-08-04
出願番号2024007900
出願日2024-01-23
発明の名称画像処理装置、画像処理装置の制御方法、及びプログラム
出願人キヤノン株式会社
代理人個人
主分類H04N 1/00 20060101AFI20250728BHJP(電気通信技術)
要約【課題】生成AIに対して画像生成の指示を適切に行うことができる仕組みを提供する。
【解決手段】画像処理装置1は、AI画像データを生成する生成AIサーバー10と通信を行う。画像処理装置1は、原稿を読み取るスキャナー装置を備える。画像処理装置1は、ユーザがオブジェクトを大まかに手書きで描いたラフ画の原稿をスキャンし、この原稿のスキャン画像データを生成する。画像処理装置1は、このスキャン画像データに基づいて生成AIサーバー10にAI画像データを生成させる。
【選択図】図1
特許請求の範囲【請求項1】
原稿を読み取る読取手段と、
前記読取手段によって前記原稿を読み取ることによって得られた第1の画像データに基づいて生成AIに第2の画像データを生成させる手段と、
前記生成AIによって生成された第2の画像データを受信する手段とを備えることを特徴とする画像処理装置。
続きを表示(約 880 文字)【請求項2】
原稿を撮影する撮影手段と、
前記撮影手段によって前記原稿を撮影することによって得られた第1の画像データに基づいて生成AIに第2の画像データを生成させる手段と、
前記生成AIによって生成された第2の画像データを受信する手段とを備えることを特徴とする画像処理装置。
【請求項3】
前記原稿には、ユーザが手書きで描いたオブジェクトが含まれることを特徴とする請求項1又は2に記載の画像処理装置。
【請求項4】
前記生成させる手段は、前記第1の画像データから前記オブジェクトを識別し、前記識別したオブジェクトの特徴情報を含む中間データを生成し、前記中間データを前記生成AIに送信することを特徴とする請求項3に記載の画像処理装置。
【請求項5】
前記識別したオブジェクトの特徴情報となる複数の候補の中から、前記中間データに含める特徴情報をユーザに選択させる手段を更に備えることを特徴とする請求項4に記載の画像処理装置。
【請求項6】
前記原稿には、前記オブジェクトの傍に当該オブジェクトの特徴を示す文字列が描かれ、
前記中間データは、前記第1の画像データから識別された文字列を更に含むことを特徴とする請求項4に記載の画像処理装置。
【請求項7】
前記中間データをユーザに編集させる手段を更に備えることを特徴とする請求項4に記載の画像処理装置。
【請求項8】
前記生成させる手段は、前記第1の画像データを前記生成AIに送信することを特徴とする請求項1又は2に記載の画像処理装置。
【請求項9】
前記受信した第2の画像データを印刷する手段を更に備えることを特徴とする請求項1又は2に記載の画像処理装置。
【請求項10】
前記生成させる手段は、ユーザに設定された印刷設定に対応する第2の画像データを前記生成AIに生成させることを特徴とする請求項9に記載の画像処理装置。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本発明は、画像処理装置、画像処理装置の制御方法、及びプログラムに関する。
続きを表示(約 1,800 文字)【背景技術】
【0002】
ユーザが入力したキーワードを用いて画像を生成するAIGC(AI-Generated Content:生成的人工知能)システムが知られている。AIGCシステムでは、キーワードとして、例えば、自然言語の文字列からなるプロンプトが入力される(特許文献1参照)。AIGCシステムは、ユーザが入力したプロンプトに対応するオブジェクトを含む画像を生成する。これにより、ユーザは、AIGCシステムにプロンプトを入力するだけで、人物や車等といった、このプロンプトに対応するオブジェクトを含む画像を取得することができる。
【先行技術文献】
【特許文献】
【0003】
US2023/0267652A1
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、上述したプロンプトを画像生成の指示として用いる構成では、ユーザは、例えば、人物がどの向きを向いているかといった構図に関する指示や、背景に関する指示を適切に行うことができないことがある。
【0005】
本発明は、生成AIに対して画像生成の指示を適切に行うことができる仕組みを提供することを目的とする。
【課題を解決するための手段】
【0006】
上記目的を達成するために、本発明の画像処理装置は、原稿を読み取る読取手段と、前記読取手段によって前記原稿を読み取ることによって得られた第1の画像データに基づいて生成AIに第2の画像データを生成させる手段と、前記生成AIによって生成された第2の画像データを受信する手段とを備えることを特徴とする。
【発明の効果】
【0007】
本発明によれば、生成AIに対して画像生成の指示を適切に行うことができる。
【図面の簡単な説明】
【0008】
本実施の形態に係る画像処理装置を含むAIGCシステムの構成を概略的に示す構成図である。
図1のコントローラーの構成を概略的に示すブロック図である。
図1の生成AIサーバーの構成を概略的に示すブロック図である。
図1の画像処理装置が生成AIサーバーから受信したAI画像データを用いて行う処理について説明するための図である。
図1の操作部に表示されるUI画面の一例を示す図である。
図1の操作部に表示される設定画面の一例を示す図である。
図6の設定画面における操作ボタンの設定について説明するための図である。
図1の画像処理装置によって実行されるAI画像データの生成制御処理の手順を示すフローチャートである。
図8のAI画像データの生成制御処理における各工程の詳細を説明するための図である。
【発明を実施するための形態】
【0009】
以下、添付図面を参照して本発明の実施の形態を詳しく説明する。なお、以下の実施の形態は特許請求の範囲に係る本発明を限定するものでなく、また、本実施の形態で説明されている特徴の組み合わせの全てが本発明の解決手段に必須のものとは限らない。
【0010】
図1は、本実施の形態に係る画像処理装置1を含むAIGCシステム(AI-Generated Content:生成的人工知能)の構成を概略的に示す構成図である。AIは、Artificial Intelligenceの略である。図1において、このAIGCシステムは、画像処理装置1、コンピューター9、及び生成AIサーバー10で構成される。画像処理装置1、コンピューター9、及び生成AIサーバー10は、LAN/Internet8経由で互いに通信可能である。このAIGCシステムでは、画像処理装置1は、ユーザがオブジェクトを大まかに手書きで描いたラフ画の原稿を読み取ってこの原稿のデジタル画像データ(以下、「スキャン画像データ」とする。)を生成する。画像処理装置1は、このスキャン画像データに基づいて画像生成要求を生成AIサーバー10に送信する。生成AIサーバー10は、受信した画像生成要求に従って、色付きのリアルな画像データ(以下、「AI画像データ」とする。)を生成する生成AIを備える。生成AIサーバー10は、生成したAI画像データを画像処理装置1やコンピューター9といった画像生成要求で指定された送信先へ送信する。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

個人
音響装置
2か月前
個人
携帯端末保持具
2か月前
個人
店内配信予約システム
22日前
日本無線株式会社
音声通信方式
2か月前
サクサ株式会社
中継装置
29日前
日本精機株式会社
投影システム
3か月前
キヤノン株式会社
電子機器
21日前
日本精機株式会社
車両用表示装置
2か月前
キヤノン株式会社
撮像装置
1か月前
キヤノン株式会社
通信装置
2か月前
キヤノン電子株式会社
モバイル装置
29日前
日本精機株式会社
画像投映システム
1か月前
電気興業株式会社
無線中継器
1か月前
キヤノン電子株式会社
画像読取装置
2か月前
個人
補聴器のイヤピース耳穴挿入具
2か月前
キヤノン電子株式会社
画像読取装置
2か月前
ヤマハ株式会社
音響出力装置
3か月前
ヤマハ株式会社
音響出力装置
3か月前
ヤマハ株式会社
信号処理装置
1か月前
キヤノン株式会社
撮影システム
2か月前
キヤノン株式会社
画像表示装置
2か月前
株式会社シグマ
撮像素子及び撮像装置
2か月前
株式会社ニコン
撮像装置
9日前
日本放送協会
映像伝送システム
2か月前
キヤノン株式会社
画像処理装置
2か月前
リオン株式会社
電気機械変換器
2か月前
キヤノン株式会社
画像処理装置
2か月前
オムロン株式会社
スレーブ装置
3か月前
キヤノン株式会社
通信システム
1か月前
株式会社ヴィーネックス
カメラ
2か月前
キヤノン株式会社
映像表示装置
3か月前
シャープ株式会社
表示装置
2か月前
DXO株式会社
情報処理システム
6日前
シャープ株式会社
電子機器
2か月前
エルメック株式会社
信号伝送回路
1か月前
株式会社クーネル
音響装置
2か月前
続きを見る