出願番号 |
特願2019-017388 |
出願日 |
2019/2/1 |
出願人 |
日本放送協会 |
公開番号 |
特開2020-126360 |
公開日 |
2020/8/20 |
登録番号 |
特許第7329929号 |
特許権者 |
日本放送協会 |
発明の名称 |
学習データ拡張装置、学習装置、翻訳装置、およびプログラム |
技術分野 |
情報・通信 |
機能 |
機械・部品の製造、制御・ソフトウェア |
適用製品 |
学習データ拡張装置、学習装置、翻訳装置、およびプログラム |
目的 |
機械翻訳の精度を上げるために、既存の対訳文データを拡張して大量の対訳文データを生成することのできる学習データ拡張装置、その学習データ拡張装置で生成された学習データを用いて機械学習処理を行う学習装置、およびその学習データ拡張装置によって得られた学習データを利用した機械学習処理によるモデルに基づく翻訳装置と、そのプログラムとを提供する。 |
効果 |
機械翻訳のための学習データの量を自動的に増やすことができる。これにより、比較的低コストで、機械翻訳の精度を向上させることができる。 |
技術概要
|
学習データ拡張装置は、拡張処理部を備える。拡張処理部は、ソース言語によって記述された文と、ターゲット言語によって記述された文と、で成る入力文対を基に、前記ソース言語または前記ターゲット言語の少なくともいずれかのシソーラス情報を用いて、前記文対に含まれる表現の置換候補を選び、置換対象である前記表現を前記置換候補で置換することによって、ソース言語によって記述された文とターゲット言語によって記述された文とで成る新たな文対を生成する。 |
実施実績 |
【無】 |
許諾実績 |
【無】 |
特許権譲渡 |
【否】
|
特許権実施許諾 |
【可】
|