TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025120010
公報種別公開特許公報(A)
公開日2025-08-15
出願番号2024015195
出願日2024-02-02
発明の名称推論装置、推論方法、及びプログラム
出願人NTT株式会社,国立大学法人 筑波大学
代理人弁理士法人ITOH,個人,個人,個人
主分類G06F 40/40 20200101AFI20250807BHJP(計算;計数)
要約【課題】翻訳メモリとして対訳データを用いることなく、原言語入力文と、当該原言語入力文に類似する目的言語文とを用いた翻訳を行う。
【解決手段】推論装置において、原言語入力文をクエリとした言語横断検索を行うことにより、目的言語文の集合から前記原言語入力文に類似する複数の類似訳文を抽出する検索部と、前記原言語入力文と前記複数の類似訳文における各類似訳文とを用いて翻訳を行うことにより、複数の出力候補文を生成する推論部と、前記複数の出力候補文に対するリランキングを行うリランキング部とを備える。
【選択図】図4
特許請求の範囲【請求項1】
原言語入力文をクエリとした言語横断検索を行うことにより、目的言語文の集合から前記原言語入力文に類似する複数の類似訳文を抽出する検索部と、
前記原言語入力文と前記複数の類似訳文における各類似訳文とを用いて翻訳を行うことにより、複数の出力候補文を生成する推論部と、
前記複数の出力候補文に対するリランキングを行うリランキング部と
を備える推論装置。
続きを表示(約 490 文字)【請求項2】
前記リランキング部は、出力候補文の対数尤度を当該出力候補文の長さで正規化したスコアを用いてリランキングを行う
請求項1に記載の推論装置。
【請求項3】
前記リランキング部は、出力候補文の対数尤度と、当該出力候補文と前記原言語入力文との間の類似度とを有するスコアを用いてリランキングを行う
請求項1に記載の推論装置。
【請求項4】
推論装置が実行する推論方法であって、
原言語入力文をクエリとした言語横断検索を行うことにより、目的言語文の集合から前記原言語入力文に類似する複数の類似訳文を抽出する検索ステップと、
前記原言語入力文と前記複数の類似訳文における各類似訳文とを用いて翻訳を行うことにより、複数の出力候補文を生成する推論ステップと、
前記複数の出力候補文に対するリランキングを行うリランキングステップと
を備える推論方法。
【請求項5】
コンピュータを、請求項1ないし3のうちいずれか1項に記載の推論装置における各部として機能させるためのプログラム。

発明の詳細な説明【技術分野】
【0001】
本発明は、ニューラルネットワークを用いて機械翻訳を行う技術に関連するものである。
続きを表示(約 1,900 文字)【背景技術】
【0002】
高品質な対訳データの集合である翻訳メモリ(translation memory)を利用したニューラル機械翻訳に関する従来技術として、例えば非特許文献1、2に開示された技術がある。
【0003】
非特許文献1、2に開示された技術では、入力文と、翻訳メモリ中の原言語文との間の類似度に基づいて、入力文に類似する原言語文と対になる目的言語文を抽出し、当該目的言語文と入力文とを連結して翻訳モデルへの入力としている。このような処理により、ニューラル機械翻訳のアーキテクチャを変更することなく翻訳精度を向上させることができる。
【先行技術文献】
【非特許文献】
【0004】
Bram Bulte and Arda Tezcan. Neural fuzzy repair: Integrating fuzzy matches into neural machine translation. In Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics, pp. 1800-1809, Florence, Italy, July 2019. Association for Computational Linguistics.
Nabil Hossain, Marjan Ghazvininejad, and Luke Zettlemoyer. Simple and effective retrieve-edit-rerank text generation. In Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics, pp. 2532-2538, Online, July 2020. Association for Computational Linguistics.
【発明の概要】
【発明が解決しようとする課題】
【0005】
言語対あるいは翻訳対象領域によっては、十分な量の対訳データが存在しない場合がある。翻訳メモリとして十分な量の対訳データが存在しない場合、非特許文献1、2に開示された手法を適用することができない。
【0006】
本発明は上記の点に鑑みてなされたものであり、翻訳メモリとして対訳データを用いることなく、原言語入力文と、当該原言語入力文に類似する目的言語文とを用いた翻訳を行うための技術を提供することを目的とする。
【課題を解決するための手段】
【0007】
開示の技術によれば、原言語入力文をクエリとした言語横断検索を行うことにより、目的言語文の集合から前記原言語入力文に類似する複数の類似訳文を抽出する検索部と、
前記原言語入力文と前記複数の類似訳文における各類似訳文とを用いて翻訳を行うことにより、複数の出力候補文を生成する推論部と、
前記複数の出力候補文に対するリランキングを行うリランキング部と
を備える推論装置が提供される。
【発明の効果】
【0008】
開示の技術によれば、翻訳メモリとして対訳データを用いることなく、原言語入力文と、当該原言語入力文に類似する目的言語文とを用いた翻訳を行うことが可能となる。
【図面の簡単な説明】
【0009】
入力文と目的言語文の対を翻訳モデルへ入力する様子を示す図である。
訓練装置100の構成例を示す図である。
訓練装置100の動作例を説明するためのフローチャートである。
推論装置200の構成例を示す図である。
推論装置200の動作例を説明するためのフローチャートである。
推論処理の流れを示す図である。
実験で用いた訓練文、開発文、テスト文、及び、翻訳メモリ(目的言語文)それぞれについての文数を示す図である。
類似訳文検索法とリランキング法の違いによる翻訳精度の比較を示す図である。
装置のハードウェア構成例を示す図である。
【発明を実施するための形態】
【0010】
以下、図面を参照して本発明の実施の形態(本実施の形態)を説明する。以下で説明する実施の形態は一例に過ぎず、本発明が適用される実施の形態は、以下の実施の形態に限られるわけではない。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

NTT株式会社
試験装置および試験方法
14日前
NTT株式会社
分類装置、および分類方法
16日前
NTT株式会社
量子計算装置、及び制御装置
2日前
NTT株式会社
光増幅器及び光増幅器監視方法
2日前
NTT株式会社
足場を構築する施工方法及び治具
29日前
NTT株式会社
推論装置、推論方法、及びプログラム
今日
NTT株式会社
置局設計装置、置局設計方法及びプログラム
8日前
NTT株式会社
配送計画装置、配送計画方法、及びプログラム
8日前
NTT株式会社
量子計算装置、量子計算方法、及びプログラム
24日前
NTT株式会社
移動ロボット、移動量推定方法、及びプログラム
10日前
NTT株式会社
通信制御システム、通信制御方法及びプログラム
8日前
NTT株式会社
画像処理装置、画像処理方法及び画像処理プログラム
今日
NTT株式会社
簡易な方法で光ファイバをセンサ化するシステム及び方法
3日前
富士通株式会社
データ転送制御装置および情報処理装置
1日前
富士通株式会社
データ転送制御装置および情報処理装置
1日前
NTT株式会社
伝送システム、送信装置、受信装置、伝送方法およびプログラム
8日前
NTT株式会社
基地局及び端末
23日前
NTT株式会社
音響信号出力装置
1か月前
NTT株式会社
通信ネットワークシステム、通信方法、通信端末およびプログラム
8日前
NTT株式会社
送信局及び受信局
2日前
NTT株式会社
運動耐容能推定方法、運動耐容能推定装置及びコンピュータプログラム
11日前
NTT株式会社
電磁界推定システム、電磁界推定装置、電磁界推定方法および電磁界推定用プログラム
10日前
NTT株式会社
収集装置、収集方法および収集プログラム
14日前
NTT株式会社
制御装置、制御方法、無線通信システム、及びプログラム
8日前
NTT株式会社
直流配電システム、制御装置、動作状態判定方法、及びプログラム
1か月前
個人
裁判のAI化
29日前
個人
工程設計支援装置
今日
個人
情報処理システム
1か月前
個人
フラワーコートA
8日前
個人
記入設定プラグイン
1か月前
個人
検査システム
1か月前
個人
介護情報提供システム
15日前
個人
設計支援システム
21日前
個人
設計支援システム
21日前
個人
携帯情報端末装置
1日前
個人
不動産売買システム
1か月前
続きを見る