出願番号 |
特願2009-043828 |
出願日 |
2009/2/26 |
出願人 |
独立行政法人情報通信研究機構 |
公開番号 |
特開2010-198438 |
公開日 |
2010/9/9 |
登録番号 |
特許第5454763号 |
特許権者 |
国立研究開発法人情報通信研究機構 |
発明の名称 |
文の対中の単語対応付装置及びそのコンピュータプログラム |
技術分野 |
情報・通信 |
機能 |
制御・ソフトウェア |
適用製品 |
翻訳システム |
目的 |
扱われる言語の対に関わりなく、相当の再現率で高い精度を達成できる、文対応付済対訳コーパスの単語対応付けのための装置を提供する。 |
効果 |
扱われる言語の対に関わりなく、相当の再現率で高い精度を達成できる、文対応付対訳コーパスの単語対応付けのための装置を提供することができる。 |
技術概要
 |
単語対応付け装置は、単語対応付対訳コーパスと、素性セットを抽出し、文の対の各々における各単語対に対応付ラベルを割当てる素性抽出モジュールと、素性セットと対応付ラベルとを用いて、CRF単語対応付モデルの学習を行なうCRFモジュールと、CRF単語対応付モデルを用いて入力された文の対の単語を対応付ける対応付モジュールと、を含む。 素性抽出モジュールは、ダイス係数、POSタグ、語幹、Bi−dic尺度、又は単語対の相対的な文の位置、又はこれら素性のいずれかの組合せを含む、ユニグラム素性を計算する。素性セットはさらに、文脈素性又はマルチグラム素性を含んでもよい。 |
イメージ図 |
|
実施実績 |
【無】 |
許諾実績 |
【無】 |
特許権譲渡 |
【否】
|
特許権実施許諾 |
【可】
|