TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025075134
公報種別公開特許公報(A)
公開日2025-05-15
出願番号2023186084
出願日2023-10-31
発明の名称字幕制作装置
出願人株式会社テレビ朝日クリエイト
代理人個人
主分類H04N 5/278 20060101AFI20250508BHJP(電気通信技術)
要約【課題】視聴者が読み易い・理解し易い形態の字幕を自動で制作する。
【解決手段】字幕制作装置は、放送音声に関する音声データの音声認識結果を文字情報として取得する文字情報取得手段と、文字情報を所定規則に従って整形し、整形済文字情報を生成する文字情報整形手段と、字幕送出システムへ整形済文字情報を通知する放送用文字情報通知手段と、を有し、文字情報に基づいて、処理単位であり文形態である中間文字情報を生成し、文字情報整形手段は、中間文字情報について、文頭から所定文字数位置までに句読点がある場合は、句読点位置で処理単位を分け、文頭から所定文字数位置までに句読点がない場合は、文頭から所定文字数位置付近で前記処理単位を分け、処理単位毎の中間文字情報に一行を所定文字数以下とする自動改行処理エンジンによる処理及び該処理結果を所定行数以下となるように分ける処理を適用し、所定行数以下となる整形済文字情報を生成する。
【選択図】図2
特許請求の範囲【請求項1】
放送音声に関する音声データの音声認識結果を文字情報として取得する文字情報取得手段と、
前記文字情報を所定規則に従って整形し、整形済文字情報を生成する文字情報整形手段と、
放送用原映像に字幕情報を合成した放送用映像を放送する字幕送出システムへ、前記整形済文字情報を通知する放送用文字情報通知手段と、を有し、
前記文字情報整形手段が、前記文字情報に基づいて、処理単位であり、文形態である中間文字情報を生成し、前記中間文字情報について、文頭から所定文字数位置までに句読点がある場合、句読点位置で前記処理単位を分け、文頭から所定文字数位置までに句読点がない場合、文頭から所定文字数位置付近で前記処理単位を分け、前記処理単位毎の前記中間文字情報に一行を所定文字数以下とする自動改行処理エンジンによる処理及び該処理結果を所定行数以下となるように分ける処理を適用することによって、所定行数以下となる前記整形済文字情報を生成することを特徴とする字幕制作装置。
続きを表示(約 1,500 文字)【請求項2】
前記文字情報整形手段が、前記文頭から所定文字数位置までに句読点がない場合、単語の途中で前記処理単位を分けないようにすることを特徴とする請求項1に記載の字幕制作装置。
【請求項3】
各前記整形済文字情報に、前記字幕送出システムに通知するまでの待機時間を設定する待機時間設定手段と、
前記待機時間中、処理継続の可否判断をユーザーに行わせるために、前記整形済文字情報を表示装置に表示させる文字情報表示手段と、
前記処理継続を否と判断するユーザー操作を受け付けた場合、前記ユーザー操作の対象である前記整形済文字情報に関する前記放送用文字情報通知手段による処理を停止させる処理停止手段と、を有することを特徴とする請求項1に記載の字幕制作装置。
【請求項4】
前記文字情報整形手段が、所定文字を該所定文字とは異なる所定文字へ置換することを特徴とする請求項1に記載の字幕制作装置。
【請求項5】
前記文字情報整形手段が、前記整形済文字情報から、文中の読点及び行頭の句点を削除することを特徴とする請求項1に記載の字幕制作装置。
【請求項6】
前記音声データを外部装置から取得する音声データ取得手段と、
前記音声データを外部の音声認識サーバーに通知する音声データ通知手段と、を有し、
前記文字情報取得手段が、前記音声認識サーバーから該音声認識サーバーが生成する前記文字情報を取得することを特徴とする請求項1に記載の字幕制作装置。
【請求項7】
文字情報取得手段が、放送音声に関する音声データの音声認識結果を文字情報として取得するステップと、
文字情報整形手段が、前記文字情報を所定規則に従って整形し、整形済文字情報を生成するステップと、
放送用文字情報通知手段が、放送用原映像に字幕情報を合成した放送用映像を放送する字幕送出システムへ、前記整形済文字情報を通知するステップと、を含み、
前記文字情報整形手段が、前記文字情報に基づいて、処理単位であり、文形態である中間文字情報を生成し、前記中間文字情報について、文頭から所定文字数位置までに句読点がある場合、句読点位置で前記処理単位を分け、文頭から所定文字数位置までに句読点がない場合、文頭から所定文字数位置付近で前記処理単位を分け、前記処理単位毎の前記中間文字情報に一行を所定文字数以下とする自動改行処理エンジンによる処理及び該処理結果を所定行数以下となるように分ける処理を適用することによって、所定行数以下となる前記整形済文字情報を生成することを特徴とする字幕制作方法。
【請求項8】
前記文字情報整形手段が、前記文頭から所定文字数位置までに句読点がない場合、単語の途中で前記処理単位を分けないようにすることを特徴とする請求項7に記載の字幕制作方法。
【請求項9】
待機時間設定手段が、各前記整形済文字情報に、前記字幕送出システムに通知するまでの待機時間を設定するステップと、
文字情報表示手段が、前記待機時間中、処理継続の可否判断をユーザーに行わせるために、前記整形済文字情報を表示装置に表示させるステップと、
処理停止手段が、前記処理継続を否と判断するユーザー操作を受け付けた場合、前記ユーザー操作の対象である前記整形済文字情報に関する前記放送用文字情報通知手段による処理を停止させるステップと、を含むことを特徴とする請求項7に記載の字幕制作方法。
【請求項10】
前記文字情報整形手段が、所定文字を該所定文字とは異なる所定文字へ置換することを特徴とする請求項7に記載の字幕制作方法。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
放送用映像に重畳させる字幕を生成し、字幕送出システム(文字情報を放送用原映像に合成して生成される放送用映像を放送するシステム)に転送する装置の技術に関する。
続きを表示(約 1,800 文字)【背景技術】
【0002】
放送用画像に重畳させる字幕を制作するためのシステムがある。近年、コンピューターを利用する自然言語処理の技術は進化を続けており、コンピューターによる音声認識処理を通して放送音声を文字情報化し、その文字情報を字幕として利用する事例がある。
【0003】
その様な背景下、例えば、特許文献1では、リアルタイムに音声認識結果から字幕を生成する際に、字幕を読みやすくするための修正の負担を低減させる字幕生成装置の技術が提案されている。
【先行技術文献】
【特許文献】
【0004】
特開2023-067353号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、上記の従来技術において、リアルタイムに音声認識結果から字幕を生成する際に、字幕を読みやすくするための修正の負担を低減させると言うが、それでも、校正作業担当者には煩雑な作業が多く残されているという問題点があった。
そこで、本発明は、上記問題点に鑑み、視聴者が読み易い・理解し易い形態の字幕を自動で制作する字幕制作装置を提供することを目的とする。
【課題を解決するための手段】
【0006】
開示する字幕制作装置の一形態は、放送音声に関する音声データの音声認識結果を文字情報として取得する文字情報取得手段と、前記文字情報を所定規則に従って整形し、整形済文字情報を生成する文字情報整形手段と、放送用原映像に字幕情報を合成した放送用映像を放送する字幕送出システムへ、前記整形済文字情報を通知する放送用文字情報通知手段と、を有し、前記文字情報整形手段が、前記文字情報に基づいて、処理単位であり、文形態である中間文字情報を生成し、前記中間文字情報について、文頭から所定文字数位置までに句読点がある場合、句読点位置で前記処理単位を分け、文頭から所定文字数位置までに句読点がない場合、文頭から所定文字数位置付近で前記処理単位を分け、前記処理単位毎の前記中間文字情報に一行を所定文字数以下とする自動改行処理エンジンによる処理及び該処理結果を所定行数以下となるように分ける処理を適用することによって、所定行数以下となる前記整形済文字情報を生成することを特徴とする。
【発明の効果】
【0007】
開示する字幕制作装置は、視聴者が読み易い・理解し易い形態の字幕を自動で制作する。
【図面の簡単な説明】
【0008】
本実施の形態に係る字幕制作装置の概要を説明する図である。
本実施の形態に係る字幕制作装置の機能ブロック図である。
本実施の形態に係る文字情報整形手段による処理を説明するための図である。
本実施の形態に係る文字情報整形手段による処理を説明するための図である。
本実施の形態に係る文字情報整形手段による処理を説明するための図である。
本実施の形態に係る文字情報整形手段による処理を説明するための図である。
本実施の形態に係る文字情報整形手段による処理を説明するための図である。
本実施の形態に係る文字情報整形手段による処理を説明するための図である。
本実施の形態に係る文字情報整形手段による処理を説明するための図である。
本実施の形態に係る文字情報整形手段による処理を説明するための図である。
本実施の形態に係る文字情報整形手段による処理を説明するための図である。
本実施の形態に係る字幕制作装置のハードウエア構成例を示す図である。
本実施の形態に係る字幕制作装置による処理例の流れを示すフローチャートである。
【発明を実施するための形態】
【0009】
図面を参照しながら、本発明を実施するための形態について説明する。
(本実施の形態に係る字幕制作装置の動作原理)
【0010】
図1乃至11を用いて、本実施の形態に係る字幕制作装置(以下、単に「本装置」という。)100の動作原理について説明する。図1は、本装置100と外部装置との接続関係を示す図であり、図2は、本装置100の機能ブロック図である。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

個人
携帯端末保持具
5日前
個人
音響装置
2日前
個人
防犯AIプラグイン
1か月前
個人
テレビ会議拡張システム
1か月前
日本精機株式会社
投影システム
8日前
日本無線株式会社
音声通信方式
2日前
日本放送協会
無線通信装置
1か月前
個人
無線中継赤外線コピーリモコン
1か月前
キヤノン電子株式会社
画像読取装置
5日前
TOA株式会社
音響システム
1か月前
キヤノン電子株式会社
画像読取装置
1か月前
ヤマハ株式会社
音響出力装置
17日前
ヤマハ株式会社
音響出力装置
17日前
キヤノン電子株式会社
画像読取装置
2日前
キヤノン株式会社
画像処理装置
4日前
オムロン株式会社
スレーブ装置
19日前
株式会社シグマ
撮像素子及び撮像装置
2日前
日本放送協会
映像伝送システム
4日前
キヤノン株式会社
映像表示装置
19日前
キヤノン株式会社
画像読取装置
1か月前
株式会社ニコン
撮像装置
1か月前
アイホン株式会社
インターホン機器
19日前
株式会社ニコン
カメラボディ
1か月前
株式会社バッファロー
無線通信装置
4日前
理想科学工業株式会社
連絡システム
1か月前
株式会社ユピテル
撮像装置等
1か月前
二幸産業株式会社
建物設備の管理装置
25日前
個人
非可聴音配信方法およびシステム
3日前
個人
対走行騒音の音量音質制御の安定化方法
4日前
17LIVE株式会社
サーバ及び方法
1か月前
キヤノン株式会社
冷却装置と電子機器
1か月前
シャープ株式会社
画像読取装置
15日前
国立大学法人東京科学大学
超音波照射器
19日前
17LIVE株式会社
サーバおよび方法
1日前
アイホン株式会社
ナースコールシステム
16日前
キヤノン株式会社
撮像装置
15日前
続きを見る