RSS
热门关键字:  数据挖掘  数据仓库  商业智能  人工智能  搜索引擎

Text Clustering using Strong Components

来源: 作者:unkonwn 时间:2004-12-05 点击:

3-强连通划分

利用强连通构件的方法,对矩阵进行划分
相似度矩阵是稀疏的
稀疏矩阵的强连通构件是密集的
密集对象之间存在较高的相似度,可以归为一类

文档相似度具有一定的传递型

数据挖掘研究院

 

文本相似度矩阵的稀疏特性过于显著,使得强连通聚类结果簇的粒度太小,因此,需要进行多次迭代的层次聚类

提取结果簇的特征向量,定义如下: 数据挖掘实验室

对上次聚类结果的簇进行计算,提取簇的特征信息
选择满足特定条件的结果簇,进行下一次迭代的聚类
重复进行1和2两步操作,直到满足指定结束条件为止。

 经过多次的迭代操作,最终结果将形成一个层次聚类结果 数据挖掘研究院

  数据挖掘研究院


数据挖掘研究院

资料全文下载

数据挖掘研究院

最新评论共有 0 位网友发表了评论
发表评论
评论内容:不能超过250字,需审核,请自觉遵守互联网相关政策法规。
匿名?