| 出願番号 |
特願2019-017388 |
| 出願日 |
2019/2/1 |
| 出願人 |
日本放送協会 |
| 公開番号 |
特開2020-126360 |
| 公開日 |
2020/8/20 |
| 登録番号 |
特許第7329929号 |
| 特許権者 |
日本放送協会 |
| 発明の名称 |
学習データ拡張装置、学習装置、翻訳装置、およびプログラム |
| 技術分野 |
情報・通信 |
| 機能 |
機械・部品の製造、制御・ソフトウェア |
| 適用製品 |
学習データ拡張装置、学習装置、翻訳装置、およびプログラム |
| 目的 |
機械翻訳の精度を上げるために、既存の対訳文データを拡張して大量の対訳文データを生成することのできる学習データ拡張装置、その学習データ拡張装置で生成された学習データを用いて機械学習処理を行う学習装置、およびその学習データ拡張装置によって得られた学習データを利用した機械学習処理によるモデルに基づく翻訳装置と、そのプログラムとを提供する。 |
| 効果 |
機械翻訳のための学習データの量を自動的に増やすことができる。これにより、比較的低コストで、機械翻訳の精度を向上させることができる。 |
技術概要
 |
学習データ拡張装置は、拡張処理部を備える。拡張処理部は、ソース言語によって記述された文と、ターゲット言語によって記述された文と、で成る入力文対を基に、前記ソース言語または前記ターゲット言語の少なくともいずれかのシソーラス情報を用いて、前記文対に含まれる表現の置換候補を選び、置換対象である前記表現を前記置換候補で置換することによって、ソース言語によって記述された文とターゲット言語によって記述された文とで成る新たな文対を生成する。 |
| 実施実績 |
【無】 |
| 許諾実績 |
【無】 |
| 特許権譲渡 |
【否】
|
| 特許権実施許諾 |
【可】
|