TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
公開番号
2025159491
公報種別
公開特許公報(A)
公開日
2025-10-21
出願番号
2024062085
出願日
2024-04-08
発明の名称
動画像符号化装置、復号装置
出願人
シャープ株式会社
代理人
個人
主分類
H04N
21/466 20110101AFI20251014BHJP(電気通信技術)
要約
【課題】
生成AIを用いるとプロンプトによるテキスト情報による画像処理が実現できる。しかし、本格的なポスト画像処理を実行しようとすると、プロンプトだけでなく、処理を定義するための必要なモデルや制御のためのパラメータが多くなるため、情報量が膨大となり、そのための符号量が大きくなってしまうという課題があった。
【解決手段】
本発明の動画像復号装置は、画像信号の符号化データを復号する画像復号装置と、
画像生成のための生成情報を識別するURIの符号化データを復号する生成情報復号装置と、
前記動画像復号装置によって復号された画像情報と、前記生成画像復号装置によって復号された生成情報から、画像を生成する画像生成装置を有することを特徴とする。
【選択図】図1
特許請求の範囲
【請求項1】
画像信号の符号化データを復号する画像復号装置と、
画像生成のための生成情報を識別するURIの符号化データを復号する生成情報復号装置と、
前記画像復号装置によって復号された画像情報と、前記生成画像復号装置によって復号された生成情報から、画像を生成する画像生成装置を有することを特徴とする動画像復号装置。
続きを表示(約 230 文字)
【請求項2】
前記生成情報復号装置は、画像生成のための生成情報を識別するURIから生成情報を取得することを特徴とする請求項1に記載の動画像復号装置。
【請求項3】
画像信号を符号化する画像符号化装置と、
前記画像符号化装置によって復号された画像情報から画像を生成するための生成情報を作成する生成情報作成装置と、
前記生成情報を識別するURIを符号化する生成情報符号化装置を有することを特徴とする動画像符号化装置。
発明の詳細な説明
【技術分野】
【0001】
本発明の実施形態は、動画像符号化装置、復号装置に関する。
続きを表示(約 1,700 文字)
【背景技術】
【0002】
動画像を効率的に伝送または記録するために、画像を符号化することによって符号化データを生成する動画像符号化装置、および、当該符号化データを復号することによって復号画像を生成する動画像復号装置が用いられている。
【0003】
具体的な動画像符号化方式としては、例えば、H.266/VVC(Versatile Video Coding)方式などが挙げられる。
【0004】
このような伝統的な画像符号化方式においては、画像を分割して符号化/復号が行われる。まず、入力画像を符号化/符号化データを復号することによって得られる局所復号画像に基づいて予測画像が生成される。次に、当該予測画像を入力画像(原画像)から減算して得られる予測誤差(「差分画像」または「残差画像」と呼ぶこともある)が符号化/復号される。
【0005】
一方、近年、ニューラルネットワークを用いた画像生成手法として拡散モデルを用いたStable Diffusionと呼ばれる生成AIの手法が開示されている。この手法では、プロンプトと呼ばれるユーザが入力したテキストに基づいて、画像を生成することができる。
【0006】
非特許文献1において、動画像符号化データに対して、生成AIでの画像処理のためのプロンプトのテキスト情報が指定できる補助拡張情報SEI(Supplemental Enhancement Information)メッセージが提案されている。
【0007】
また、非特許文献2において、動画像符号化及び復号の技術として画像の性質や、表示方法、タイミングなどを符号化データと同時に伝送するための補助拡張情報SEI(Supplemental Enhancement Information)メッセージが規定されている。ニューラルネットワークに基づくポストフィルタ処理の適用を示すニューラルネットワークポストフィルタアクティベーションSEIメッセージ(Neural-Network Post-filter Activation SEI message)が提示されている。
【先行技術文献】
【非特許文献】
【0008】
A. Hinds, G. Teniou, and S. Wenger,“AHG9: Text prompt for generative AI SEI,” Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29, JVET-AG0167, Jan. 2024.
ITU-T Rec. H.274 V3 "Versatile supplemental enhancement information messages for coded video bitstreams"
【発明の概要】
【発明が解決しようとする課題】
【0009】
非特許文献1で開示されている方法では、プロンプトによるテキスト情報で生成AIによる画像処理が実現できる。しかし、本格的なポスト画像処理を実行しようとすると、プロンプトだけでなく、処理を定義するための必要なモデルや制御のためのパラメータが多く
なるため、情報量が膨大となり、そのための符号量が大きくなってしまうという課題があった。また、バイト単位にアライメントされていない文字情報は復号してすぐには利用できないという課題がある。
【課題を解決するための手段】
【0010】
本発明の一態様に係る動画像復号装置は、画像信号の符号化データを復号する画像復号装置と、
画像生成のための生成情報を識別するURIの符号化データを復号する生成情報復号装置と、
前記動画像復号装置によって復号された画像情報と、前記生成画像復号装置によって復号された生成情報から、画像を生成する画像生成装置を有することを特徴とする。
【発明の効果】
(【0011】以降は省略されています)
この特許をJ-PlatPat(特許庁公式サイト)で参照する
関連特許
シャープ株式会社
筐体構造
1日前
シャープ株式会社
表示装置
16日前
シャープ株式会社
通信端末
10日前
シャープ株式会社
走行装置
8日前
シャープ株式会社
加熱機器
1日前
シャープ株式会社
端末装置
8日前
シャープ株式会社
表示装置
2日前
シャープ株式会社
端末装置
3日前
シャープ株式会社
画像形成装置
15日前
シャープ株式会社
アンテナ装置
2日前
シャープ株式会社
画像形成装置
3日前
シャープ株式会社
イオン発生装置
8日前
シャープ株式会社
緩衝材及び梱包体
3日前
シャープ株式会社
通信装置および制御方法
17日前
シャープ株式会社
トナー及びその製造方法
15日前
シャープ株式会社
端末装置および通信方法
9日前
シャープ株式会社
決済システム及び決済方法
4日前
シャープ株式会社
情報処理装置及び設定方法
1日前
シャープ株式会社
端末および端末の制御方法
15日前
シャープ株式会社
給紙装置および画像形成装置
9日前
シャープ株式会社
補助電源回路および電源装置
18日前
シャープ株式会社
動画像符号化装置、復号装置
4日前
シャープ株式会社
動画像符号化装置、復号装置
1日前
シャープ株式会社
定着装置および画像形成装置
9日前
シャープ株式会社
端末装置、および、基地局装置
3日前
シャープ株式会社
端末装置、および、基地局装置
9日前
シャープ株式会社
端末装置、方法、および集積回路
22日前
シャープ株式会社
端末装置、方法、および集積回路
22日前
シャープ株式会社
端末装置、方法、および集積回路
22日前
シャープ株式会社
給油管理装置、及び給油システム
1日前
シャープ株式会社
端末装置、方法、および、集積回路
3日前
シャープ株式会社
通信装置および通信装置の設置方法
17日前
シャープ株式会社
電子機器および電子機器の制御方法
16日前
シャープ株式会社
UE(User Equipment)
3日前
シャープ株式会社
画像処理装置及び画像処理装置の制御方法
22日前
シャープ株式会社
画像形成装置及び画像形成装置の制御方法
16日前
続きを見る
他の特許を見る