語彙階層構造抽出方法、装置、およびプログラム

開放特許情報番号
L2008003716
開放特許情報登録日
2008/7/25
最新更新日
2008/10/17

基本情報

出願番号 特願2006-336652
出願日 2006/12/14
出願人 独立行政法人情報通信研究機構
公開番号 特開2008-152324
公開日 2008/7/3
発明の名称 語彙階層構造抽出方法,装置,およびプログラム
技術分野 情報・通信
機能 機械・部品の製造、制御・ソフトウェア
適用製品 語彙階層構造抽出装置、およびプログラム
目的 ユーザが任意に用意した形態素情報が連結されたコーパスによって、ユーザの利用目的に合致した語彙の階層構造情報を自動的に構築できる語彙階層構造抽出方法、装置、およびプログラムを提供する。
効果 複数の語間の包含関係を多段階の階層構造として把握することができ、自然言語の構造分析処理に応用することによって、より自然な翻訳処理や文書作成処理などの応用処理を実現することが可能となる。ユーザが利用しようと思うコーパスから語彙の階層構造を自動抽出できる。そのため、ユーザが選択したコーパスが特定分野に限った特殊なコーパスであれば、抽出される語彙の階層構造も特殊なものとなり、ユーザは、所望する特定分野の語彙階層構造を得ることができる。
技術概要
図1は、この装置の構成を示す図である。2語間階層関係導出手段11は、与えられたコーパス2の形態素の集合について、2つの形態素を取り出し、形態素と連結関係にある他の形態素の包含関係を統計的指標を用いて推定し、その形態素が他の形態素を包含する度合いを示す包含度を算出し、包含度を用いて当該2語(形態素)間の階層関係(上位−下位関係)を導出し、情報ベース13に記憶する。階層構造構築手段15は、情報ベース13に記憶された2語間の階層関係について、同一形態素を上位語とする2語間の階層関係を抽出し、上位語の包含度が最も高い2語間の階層関係を初期階層に設定し、設定された2語間の階層関係の下位語が上位語であって包含度が最も高い2語間の階層関係を選択し、初期階層の下位階層として連結する。この連結処理を、抽出された2語間の階層関係について繰り返し、抽出された2語間の階層関係が連結された語彙階層構造情報3を出力する。コーパス2は、抽象名詞の分類を目的として作成されたものとし、語彙階層構造として、抽象名詞の階層構造を出力する。
実施実績 【無】   
許諾実績 【無】   
特許権譲渡 【否】
特許権実施許諾 【可】

アピール情報

導入メリット 【改善】
改善効果1 2語間の包含関係を、統計的指標を用いて導出しているため、語彙間の意味的な関係を数値によって示す語彙階層構造を出力することができる。

登録者情報

その他の情報

関連特許
国内 【無】
国外 【無】   
Copyright © 2018 INPIT