出願番号 |
特願2004-219285 |
出願日 |
2004/7/27 |
出願人 |
国立医薬品食品衛生研究所長、エヌ・ティ・ティ・コムウェア株式会社 |
公開番号 |
特開2006-039970 |
公開日 |
2006/2/9 |
登録番号 |
特許第3995099号 |
特許権者 |
国立医薬品食品衛生研究所長 |
発明の名称 |
高次元データを塊に分割する装置 |
技術分野 |
情報・通信 |
機能 |
検査・検出 |
適用製品 |
大量のデータを高速に分類するためのクラスタリングシステム |
目的 |
クラスタリング対象のデータ数、及び最終的なクラスタ数の制限を受けず、従来の手法に比較して、高速にクラスタリングが行えるクラスタリングシステムを提供する。 |
効果 |
特別に複雑な演算をすることなく、設定された閾値組に対応したクラスタリングを高速に行うことができる。
複数の閾値組(類似性閾値,密度閾値)を用いて、各閾値組毎にクラスタリングを行うことにより、各閾値組に対応するクラスタを生成し、これらのクラスタを閾値組の順番、すなわち緩い閾値から厳しい閾値まで順に並べることにより、階層構造クラスタリングに比較して短い時間で、容易にツリー構造を構成する。 |
技術概要
 |
本発明のクラスタリングシステムは、類似性閾値範囲の類似性を有するデータの組合せを抽出する類似集合抽出部と、各データポイントにおけるデータ密度が、密度閾値以上のデータを対象として抽出するデータ抽出部と、クラスタの最小のデータ番号を抽出し、クラスタラベル番号とし、クラスタラベル番号及びクラスタ内のデータ番号の対応表を生成する対応表生成部と、クラスタラベル番号のデータが、他に属することを検出すると、他のクラスタのクラスタラベル番号に書き換えるリスト入替部と複数の閾値組に対するクラスタリング結果を再構成し、適切なクラスタを抽出するクラスタリング再構成部とを有している。 |
実施実績 |
【有】 |
許諾実績 |
【無】 |
特許権譲渡 |
【否】
|
特許権実施許諾 |
【可】
|