文書分類装置、文書分類方法、プログラム及び記録媒体

開放特許情報番号
L2010005495
開放特許情報登録日
2010/9/24
最新更新日
2010/9/24

基本情報

出願番号 特願2007-145343
出願日 2007/5/31
出願人 国立大学法人九州大学
公開番号 特開2008-299616
公開日 2008/12/11
発明の名称 文書分類装置、文書分類方法、プログラム及び記録媒体
技術分野 情報・通信
機能 制御・ソフトウェア
適用製品 文書分類装置、文書分類方法
目的 クラスタの文書数の偏りを防ぐのに適した文書分類装置等の提供。
効果 低頻度語をクラスタリングに利用しないことにより、偏ったクラスタリング結果とならないようにすることができる。
技術概要
この技術では、指定された個数に複数の文書データを分類する文書分類装置は、複数の文書データから単語を抽出する単語抽出手段と、単語抽出手段により抽出された各単語が存在する文書データの数を計算する文書数計算手段と、指定された個数に基づいて、文書数計算手段により計算された文書データの数の多い単語から順に単語を抽出する単語限定手段と、単語限定手段により抽出された単語で複数の文書データをベクトル化するベクトル化手段と、ベクトル化手段により生成されたベクトルを指定された個数に分類する分類手段と、を備える。また、単語限定手段により抽出された単語から、分類手段により分類された各ベクトル群の特徴語を抽出する特徴語抽出手段を備える。
実施実績 【無】   
許諾実績 【無】   
特許権譲渡 【否】
特許権実施許諾 【可】

登録者情報

その他の情報

関連特許
国内 【無】
国外 【無】   
Copyright © 2018 INPIT