自動翻訳パターン学習装置、自動翻訳の前処理装置、及びコンピュータプログラム

開放特許情報番号
L2018002086
開放特許情報登録日
2018/10/4
最新更新日
2018/10/4

基本情報

出願番号 特願2016-227583
出願日 2016/11/24
出願人 国立研究開発法人情報通信研究機構
公開番号 特開2018-084952
公開日 2018/5/31
発明の名称 自動翻訳パターン学習装置、自動翻訳の前処理装置、及びコンピュータプログラム
技術分野 情報・通信
機能 機械・部品の製造、制御・ソフトウェア
適用製品 自動翻訳技術
目的 定型的な文章を高い精度で自動翻訳するために、自動翻訳に先立って、文の構成部品列を自動翻訳に適した順序に並べ替えるパターンを学習する自動翻訳パターン学習装置、そのパターンを用いて自動翻訳の前処理を行う前処理装置、及びそのためのコンピュータプログラムを提供すること。
効果 本発明は、任意の言語ペアに対して適用できる。ただし、日本語と英語、日本語と中国語等のように、互いの語順が大きく異なる言語ペアの間に本発明を適用することにより、語順が似通った言語ペアより大きな効果を得ることができる。
技術概要
第1の言語の文を第2の言語の文に自動翻訳により翻訳するために、前記第1の言語の文を複数個の構造部品に分解して順序を並べ替えるパターンを学習する自動翻訳パターン学習装置であって、
前記第1の言語及び前記第2の言語の対訳を記憶するための対訳記憶手段と、
前記対訳記憶手段に記憶された対訳の各々について、前記第1の言語の文の構造部品の出現順序と、対応する前記第2の言語の文の構造部品の出現順序との対応関係が変化する位置を前記第1の言語の文及び前記第2の言語の文の各々の分割位置として検出するための検出手段と、
前記第1の言語の文の、連続する所定個数の単語列と、当該単語列内の所定位置に前記分割位置があるか否かを示す正解情報を付したデータを機械学習の学習データとして生成するための学習データ生成手段と、
前記学習データ生成手段により生成された学習データを用いて、機械学習により、前記第1の言語の文の前記所定個数の入力単語列が与えられたときに、当該入力単語列内の前記所定位置に前記分割位置があるか否かを判定するための判定モデルの学習を行うための学習手段とを含む、自動翻訳パターン学習装置。
実施実績 【無】   
許諾実績 【無】   
特許権譲渡 【否】
特許権実施許諾 【可】

登録者情報

その他の情報

関連特許
国内 【無】
国外 【無】   
Copyright © 2018 INPIT