疑似対訳データ生成装置、機械翻訳処理装置、および疑似対訳データ生成方法

開放特許情報番号
L2019001776
開放特許情報登録日
2019/10/11
最新更新日
2019/10/11

基本情報

出願番号 特願2018-037055
出願日 2018/3/2
出願人 国立研究開発法人情報通信研究機構
公開番号 特開2019-153023
公開日 2019/9/12
発明の名称 疑似対訳データ生成装置、機械翻訳処理装置、および疑似対訳データ生成方法
技術分野 情報・通信
機能 機械・部品の製造
適用製品 エンコーダ・デコーダ方式のニューラル機械翻訳技術
目的 目的言語の単言語コーパスを用いてエンコーダ(アテンションを含む)を強化し、翻訳器全体の精度向上させるニューラル機械翻訳のモデル訓練方法と当該モデル訓練方法を実行するための機械翻訳システムを実現する。また、機械翻訳システムを構成する疑似対訳データ生成装置、機械翻訳処理装置、および、上記機械翻訳システムで実行される疑似対訳データ生成方法を実現する。
効果 目的言語の単言語コーパスを用いてエンコーダ(アテンションを含む)を強化し、翻訳器全体の精度向上させるニューラル機械翻訳のモデル訓練方法と当該モデル訓練方法を実行するための機械翻訳システムを実現することができる。また、本発明によれば、上記機械翻訳システムを構成する疑似対訳データ生成装置、機械翻訳処理装置、および、上記機械翻訳システムで実行される疑似対訳データ生成方法を実現することができる。
技術概要
目的言語単言語コーパスから取得した1つの目的言語データに対して機械逆翻訳処理を施すことでN個(N:2以上の自然数)の疑似原言語データを取得する逆翻訳部と、
前記1つの目的言語データと、前記逆翻訳部により取得された前記N個の疑似原言語データのそれぞれを組にすることでN組の疑似対訳データを取得する疑似対訳データ取得部と、
を備える疑似対訳データ生成装置。
実施実績 【無】   
許諾実績 【無】   
特許権譲渡 【否】
特許権実施許諾 【可】

登録者情報

その他の情報

関連特許
国内 【無】
国外 【無】   
Copyright © 2019 INPIT