出願番号 |
特願2016-034682 |
出願日 |
2016/2/25 |
出願人 |
国立研究開発法人情報通信研究機構 |
公開番号 |
特開2017-151804 |
公開日 |
2017/8/31 |
登録番号 |
特許第6703709号 |
特許権者 |
国立研究開発法人情報通信研究機構 |
発明の名称 |
自動翻訳の素性重み最適化装置及びそのためのコンピュータプログラム |
技術分野 |
情報・通信 |
機能 |
機械・部品の製造、制御・ソフトウェア |
適用製品 |
自動翻訳を行うシステムにおいて、各素性に割り当てられる重みを最適化するための装置 |
目的 |
より確実に、素性重みを高い精度で最適化できる素性重みの最適化装置を提供する。 |
効果 |
ドメイン適応において、複数のドメインについて重みを同時に最適化できる。しかも最適化された結果を用いて翻訳を行うと、他の適応方式と比較して確実に翻訳の品質が向上し、訓練コーパスを大規模にしても、単独モデル方式、コーパス結合モデル方式の翻訳品質を上回った。100万文規模の大規模コーパスに適用しても、翻訳品質を下げることがなく、ドメインによっては品質向上の効果があることを示した。この結果、他の適応方式と比較して、本発明の適応方式によれば確実にドメインごとの翻訳精度を高めることができる。 |
技術概要
 |
自動翻訳の素性重み最適化装置は、複数のドメイン開発セット212と、複数のドメイン開発セット212を用い、複数のドメイン別統計モデル272及び汎用統計モデル274から得られる素性又はその対数の線形補間を用いて自然言語の翻訳を行う際の各素性重みを最適化する素性重み最適化部278とを含む。素性重み最適化部278は、ドメイン開発セット212の各々について設けられたドメイン別素性記憶領域を持ち、その各々は、汎用統計モデルの素性を記憶する第1の領域と、複数のドメイン開発セットから得られる素性を記憶する複数の第2の領域と、重みの最適化に用いられる損失関数の値を記憶する第3の領域とを含む。損失関数は、自動翻訳による翻訳文とその参照訳との間の相違を表す関数である。 |
実施実績 |
【無】 |
許諾実績 |
【無】 |
特許権譲渡 |
【否】
|
特許権実施許諾 |
【可】
|