出願番号 |
特願2008-113908 |
出願日 |
2008/4/24 |
出願人 |
日本放送協会 |
公開番号 |
特開2009-265889 |
公開日 |
2009/11/12 |
登録番号 |
特許第5184195号 |
特許権者 |
日本放送協会 |
発明の名称 |
言語処理装置およびプログラム |
技術分野 |
情報・通信 |
機能 |
制御・ソフトウェア、検査・検出 |
適用製品 |
言語処理装置およびそのコンピュータプログラム |
目的 |
互いに関係を持つ可能性の高い名詞の対のみを精度良く抽出するとともに、それら対をなす2つの名詞の関係も抽出することのできる言語処理装置を提供する。 |
効果 |
テキストに含まれる関係のある単語対とその関係名を表わす単語を抽出することができる。また、出現頻度が低い単語間の関係も高精度に推定することができる。また、関係を構成するときの構文構造の特徴も抽出できる。このような技術は、機械によるテキスト理解の分野でも有用であり、今後、大量のテキストを機械により解析して重要な情報を抽出するような情報分析などの分野での応用が期待できる。 |
技術概要
 |
言語処理装置は、入力テキストデータを基に、一つの文に含まれる単語のペアを処理対象単語ペアとして選択するとともに処理対象単語ペアの出現頻度特徴を抽出する処理対象単語ペア特徴抽出部と、共起単語を選択するとともに、共起単語の出現頻度特徴を抽出する共起単語特徴抽出部と、処理対象単語ペアと共起単語との当該文中の構文構造を抽出するとともに、構文構造の出現頻度特徴を抽出する構文構造特徴抽出部と、得られたこれらの出現頻度特徴のデータを用いて機械学習処理により、処理対象単語ペアの条件付き確率と、共起単語の条件付き確率と、構文構造の条件付き確率とを算出し、学習結果データとして学習結果データ記憶部に書き込む機械学習処理部とを具備する。 |
実施実績 |
【無】 |
許諾実績 |
【無】 |
特許権譲渡 |
【否】
|
特許権実施許諾 |
【可】
|