
基于K-means、MBSAS和DBSCAN算法的新闻组18828文本聚类器
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本作品构建了一个高效的新闻组文本聚类器,运用了K-means、MBSAS及DBSCAN三种算法,旨在从18828篇文档中自动识别主题与模式。
基于Kmeans算法、MBSAS算法及DBSCAN算法的newsgroup18828文本聚类器程序运行方法如下:使用eclipse打开工程,并将newsgroup文档集解压到F:\DataMiningSample\orginSample目录下,同时在F:\DataMiningSample\路径下建立如附件所示的数据子目录结构。停用词表也应放置于F:/DataMiningSample/目录中。完成上述步骤后即可运行eclipse工程。本项目源代码包含三个独立的工程文件:DataMiningCluster-Kmeans算法及SVD分解降维代码、MBSAS-MBSAS算法代码和DBSCAN-DBSCAN算法代码,结果文件分别为Kmeans_result 和 MBSAS_result。
全部评论 (0)
还没有任何评论哟~


