特定データの抽出方法、抽出装置、およびプログラム

開放特許情報番号
L2005006178
開放特許情報登録日
2005/6/11
最新更新日
2015/12/21

基本情報

出願番号 特願2003-055193
出願日 2003/3/3
出願人 独立行政法人情報通信研究機構
公開番号 特開2004-265169
公開日 2004/9/24
登録番号 特許第3843320号
特許権者 国立研究開発法人情報通信研究機構
発明の名称 特定データの抽出方法、抽出装置、およびプログラム
技術分野 情報・通信
機能 制御・ソフトウェア
適用製品 文書データ、用語データ
目的 既存の用語辞書からでは抽出することができない特定データを抽出できる特定データの抽出方法、抽出装置およびそのプログラムの提供。
効果 既存の用語辞書によらなくても特定データを抽出することができる。特に、分野や著者に応じて、どの用語がどのような形に訳される傾向にあるのかを抽出することができる。
技術概要
この技術では、文書データの中から関連性の高いデータの組み合わせを特定データとして抽出する特定データの抽出方法は、複数の文書データの中から各用語データを抽出する工程を備えると共に、各文書データ中に出現する用語データの数に応じて、用語データ毎に、用語データと各文書データとの相関度を示す値を付与する工程を備える。また、用語データと各文書データとの相関度を示す値を用いて、用語データ毎に、他の用語データと組み合わせた場合の類似度を算出する工程を備え、類似度が高い順に所定数の用語データの組み合わせを特定データとして、または、類似度が所定の閾値を超える用語データの組み合わせを特定データとして抽出する工程を含む。
実施実績 【無】   
許諾実績 【無】   
特許権譲渡 【否】
特許権実施許諾 【可】

登録者情報

その他の情報

関連特許
国内 【無】
国外 【無】   
Copyright © 2018 INPIT