基于图划分的谱聚类算法在文本挖掘中应用
沈亚田;沈夏炯;张磊
【期刊名称】《计算机技术与发展》
【年(卷),期】2009(019)005
【摘要】传统文本挖掘算法都是建立在凸球形的样本空间上,当样本空间不为凸时,算法就陷入"局部"最优.为了满足"全局"最优,引进了无向图结构表示文档之间的相似关系,由无向图建立文档之间的相邻接矩阵,谱聚类算法是通过对邻接矩阵进行分析,导出聚类对象的新特征,利用新的特征对原数据进行聚类.通过实验对该算法和其他的文本挖掘的算法进行分析比较,实验结果表明该算法聚类效果比传统数据挖掘方法好.最后指出谱聚类的不足和进一步的研究方向.
【总页数】3页(96-98)
【关键词】谱聚类;邻接矩阵;文本挖掘;正则割;Laplancian矩阵
【作者】沈亚田;沈夏炯;张磊
【作者单位】河南大学,计算机与信息工程学院,河南,开封,475001;河南大学,计算机与信息工程学院,河南,开封,475001;河南大学,计算机与信息工程学院,河南,开封,475001
【正文语种】中文
【中图分类】TP301.6
【相关文献】
1.基于文本挖掘的聚类算法研究 [J], 徐东亮; 董开坤; 李斌; 王研芬
2.基于粗糙集的群体智能文本挖掘聚类算法 [J], 杨彦明; 陈卓; 魏振钢
3.ISODATA动态聚类算法在文本挖掘中的应用 [J], 李湘云