統計的機械翻訳のための言語独立な単語セグメント化

開放特許情報番号
L2012002748
開放特許情報登録日
2012/9/21
最新更新日
2015/10/22

基本情報

出願番号 特願2009-273137
出願日 2009/12/1
出願人 独立行政法人情報通信研究機構
公開番号 特開2011-118496
公開日 2011/6/16
登録番号 特許第5565827号
特許権者 国立研究開発法人情報通信研究機構
発明の名称 統計的機械翻訳のための言語独立な単語セグメント化のための文分離器トレーニング装置、そのためのコンピュータプログラム及びコンピュータ可読媒体。
技術分野 情報・通信
機能 機械・部品の製造、その他
適用製品 自然言語処理の前処理
目的 言語学に導かれた単語セグメント化ツールを必要としない、文分離器トレーニング装置を提供する。
言語学的に導かれた単語セグメント化ツールを必要とせず、最適な文分離器を自動的に生成する、文分離器トレーニング装置を提供する。
効果 言語学的に導かれた単語セグメント化ツールを必要とせず、統計的に最適化された文分離器を自動的に生成する文分離器トレーニング装置が提供される。
言語学的に導かれた単語セグメント化ツールを必要とせず比較的正確な文分離器を自動的に生成する文分離器トレーニング装置が提供される。
技術概要
文分離器は、文字ベースの分離器、バイリンガルコーパスを利用してSMTをトレーニングする第1のトレーナ、SMTの評価器、SMTによる対応付け結果を用い第2の分離器をトレーニングする第2のトレーナ、第2のトレーナによりトレーニングされた第2の分離器を利用してソース文をセグメント化するセグメント化装置、第1及び第2のトレーナ、評価器、並びに第2の分離器を、性能が悪くなるまで繰返し動作させる制御器、最初は第1の分離器によってセグメント化されたコーパスを、以降の繰返しでは第2の分離器によりセグメント化されたコーパスを選択してレーニングコーパスとして第1のトレーナに与える選択器とを含む。
実施実績 【無】   
許諾実績 【無】   
特許権譲渡 【否】
特許権実施許諾 【可】

登録者情報

その他の情報

関連特許
国内 【無】
国外 【無】   
Copyright © 2018 INPIT