目的
たとえ原言語文と目的言語文との間で情報の過不足がある対訳文を用いて学習する場合にも、訳抜けの起こりにくい機械学習を実現するもの、またのそのような翻訳装置、およびプログラムを提供できるようする。
効果
学習データの対訳文対において原言語文の内容に対して目的言語文の内容が不足している場合にも、そのような学習データを用いた学習を行い、訳抜けがより起こりにくい翻訳処理を実現することが可能となる。
技術概要
原言語から目的言語への翻訳を行うための機械学習可能なモデルを持つ機械翻訳部と、
原言語文と目的言語文とで成る対訳文対において、前記原言語文に対応する原言語側の語の列に含まれる各々の原言語側の語について、前記目的言語文に対応する目的言語側の語の列に対訳として対応する目的言語側の語が存在するか否かに応じたラベルを決定し、前記原言語側の語の列に対応するラベルの列を生成するラベル系列生成部と、
学習モードにおいて、前記原言語側の語の列と前記ラベルの列とに基づく入力側データと、前記目的言語側の語の列に基づく出力側データとを用いて、前記機械翻訳部の前記モデルの機械学習を行うように制御する制御部と、
を備える翻訳装置。