対象文書からキーワードを抽出する方法、システムおよびプログラム

開放特許情報番号
L2010005384
開放特許情報登録日
2010/9/17
最新更新日
2011/8/26

基本情報

出願番号 特願2005-128532
出願日 2005/4/26
出願人 国立大学法人佐賀大学
公開番号 特開2006-309347
公開日 2006/11/9
登録番号 特許第4787955号
特許権者 国立大学法人佐賀大学
発明の名称 対象文書からキーワードを抽出する方法、システムおよびプログラム
技術分野 情報・通信
機能 制御・ソフトウェア
適用製品 キーワード抽出装置、情報検索システム
目的 他の文字列の評価項目を適切に用い、より対象文書の特徴を示すキーワードを精度良く抽出するキーワード抽出装置の提供を目的とする。
効果 適切に対象文書のプロダクションルールのみを選定でき、正確な推論を実行してキーワードを抽出することができる。
技術概要
入力部10で対象文書データが取り込まれ、対象文書データから文書中の構成要素に基づき文書形式が決定され、対象文書データからレイアウト情報、フォントサイズ情報及び出現頻度情報を生成し、条件部が対象文書の形態素の位置、フォントサイズ及び出現頻度の評価項目要素の評価項目状態であり、条件部がキーワードであるか否かであり、文書形式毎にある知識を有するプロダクションシステム27のワーキングメモリに対象文書のレイアウト情報、フォントサイズ情報及び出現頻度情報を入力し、プロダクションシステム27が推論を実行するので、まず対象文書の文書形式を求め、対象文書のレイアウト情報、フォントサイズ情報及び出現頻度情報を用いて推論を実行しており、適切に対象文書のプロダクションルールのみを選定でき、正確な推論を実行してキーワードを抽出することができる。
イメージ図
実施実績 【無】   
許諾実績 【無】   
特許権譲渡 【否】
特許権実施許諾 【可】

登録者情報

その他の情報

関連特許
国内 【無】
国外 【無】   
Copyright © 2021 INPIT