句テーブル生成器及びそのためのコンピュータプログラム

開放特許情報番号
L2012002466
開放特許情報登録日
2012/8/17
最新更新日
2015/10/22

基本情報

出願番号 特願2010-046158
出願日 2010/3/3
出願人 独立行政法人情報通信研究機構
公開番号 特開2011-180941
公開日 2011/9/15
登録番号 特許第5500636号
特許権者 国立研究開発法人情報通信研究機構
発明の名称 句テーブル生成器及びそのためのコンピュータプログラム
技術分野 情報・通信
機能 制御・ソフトウェア、その他
適用製品 自然言語処理、特に、SMT(統計的機械翻訳)又は自然言語理解における入力テキストを信頼性高くセグメント化すること
目的 複数のソース言語単語セグメント化方式をSMTデコード処理に統合して翻訳の品質を高める、単語セグメント化システム及び単語セグメント化方法を提供する。
効果 言語独立であり、どのような単語セグメント化方式にも対応できる。言語学的に動機づけされたセグメント化方式と組合せることも、モノリンガル又はバイリンガルコーパスから自動的に学習されたセグメント化方式と組合せることもできる。
。対応付けに基づく単語境界注釈を用いて、ME法が適用され、最適なソース言語単語セグメント化が学習される。
技術概要
第1の言語と第2の言語との統計的機械翻訳で用いられる句テーブルを生成するための句テーブル生成器であって、前記句テーブル生成器は翻訳対のバイリンガルコーパスを記憶するための手段を含み、翻訳対の各々は前記第1の言語のソース文と第2の言語のターゲット文とを含み、さらに前記バイリンガルコーパスを利用して統計的機械翻訳手段をトレーニングするためのトレーニング手段を含み、前記統計的機械翻訳手段は前記トレーニング手段のトレーニングの間に複数個の句テーブルを出力し、前記複数個の句テーブルの各々は、前記第1の言語のソース句、前記第2の言語のターゲット句、及び前記ソース句がトレーニングの間に前記ターゲット句に翻訳される確率を示すスコアを各々が含むエントリを含み、前記複数個の句テーブルは前記バイリンガルコーパスの前記ソース文の異なるセグメント化を反映しており、さらに前記複数個の句テーブルを、前記複数個の句テーブルにおいて同一のソース及びターゲット句対を有するエントリ対がそれぞれ単一のエントリに統合された統合句テーブルに統合するための句テーブル統合手段を含む、句テーブル生成器。
実施実績 【無】   
許諾実績 【無】   
特許権譲渡 【否】
特許権実施許諾 【可】

登録者情報

その他の情報

関連特許
国内 【無】
国外 【無】   
Copyright © 2018 INPIT