文書分類装置及びプログラム

開放特許情報番号
L2008000379
開放特許情報登録日
2008/2/1
最新更新日
2015/8/20

基本情報

出願番号 特願2006-154126
出願日 2006/6/2
出願人 独立行政法人情報通信研究機構
公開番号 特開2007-323454
公開日 2007/12/13
登録番号 特許第4931111号
特許権者 国立研究開発法人情報通信研究機構
発明の名称 文書分類装置及びプログラム
技術分野 情報・通信
機能 制御・ソフトウェア
適用製品 特許文書分類装置
目的 一つの文書に複数の分類が付与される、Multi−classの分類問題を扱い、出現頻度の大きい分類のうち、どの分類までを、その文書の分類とするかを自動で決定することのできる文書分類装置の提供。
効果 文書類似度算出手段で入力された文書と予め分類の付与された文書集合との類似度をキーワードを抽出して算出し、文書抽出手段で予め分類の付与された文書集合から入力された文書と最も類似する指定数の文書を抽出し、スコア算出手段で類似度を加味した同じ分類の数により抽出した指定数の文書の分類のスコアを算出し、分類集合抽出手段で算出したスコアが指定値より大きい分類を抽出するため、入力した文書に、自動で分類を付与することができる。
技術概要
この技術は、分類する文書を入力する入力手段と、入力された文書と予め分類の付与された文書集合との類似度をキーワードを抽出して算出する文書類似度算出手段と、予め分類の付与された文書集合から入力された文書と最も類似する指定数の文書を抽出する文書抽出手段と、類似度を加味した同じ分類の数により抽出した指定数の文書の分類のスコアを算出するスコア算出手段と、算出したスコアが指定値より大きい分類を抽出する分類集合抽出手段とを備える。このため、入力した文書に、自動で分類を付与することができる。また、この文書分類装置においては、抽出した複数の文書の分類の技術的観点を二次元の表にし、この表に分類された技術がどこにあるかの印を設けている。このため、分類の付与されていない技術的観点(開発されていない技術)が何であるかを容易に見つけることができる。更に、技術的観点を並べ替え、印が付いていない箇所を集め直しており、このため、分類のない穴をより容易に見つけることができる。
実施実績 【無】   
許諾実績 【無】   
特許権譲渡 【否】
特許権実施許諾 【可】

登録者情報

その他の情報

関連特許
国内 【無】
国外 【無】   
Copyright © 2018 INPIT