
K-means文本聚类算法结合PAC降维及Matplotlib展示聚类结果图
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本研究采用K-means算法对文本数据进行聚类,并利用PAC技术实现降维处理,最后使用Matplotlib库可视化聚类效果。
该资源主要参考我的博客中的内容:《python》Kmeans文本聚类算法+PAC降维+Matplotlib显示聚类图像。输入文档为txt格式,包含1000行数据,每行都是经过分词处理的文本。本段落重点讲述以下几点:
1. 使用scikit-learn计算文本内容的tfidf并构造N*M矩阵(其中N代表文档数量,M表示特征词汇的数量);
2. 利用scikit-learn中的K-means算法进行文本聚类;
3. 应用PAC技术对数据进行降维处理,并将每行文本转换为二维数据。
全部评论 (0)
还没有任何评论哟~


