
Kmeans聚类算法已用Python编程实现。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本节内容源于上学期模式识别课程作业的整理,其中首道题目为K均值聚类算法,所使用的数据集为鸢尾花数据集Iris,分类数量k设定为3,数据维度则为4。 聚类算法本质上是一种旨在将给定样本数据Sample,按照相似度进行分组的方法。理解了这一点后,应该就能明白聚类算法的核心作用了吧。简单来说,它就是对数据进行分类。首先,我们需要思考如何评估不同数据点之间的相似度。例如,如果有一群说着不同语言的人,通常我们会根据他们的方言来进行聚类(当然,也可以根据其他特征如身高来指定聚类标准)。在此情境中,“语言的相似性”(或“身高”)就成为了衡量相似度的关键指标。此外,还需要考虑处理海量数据的情况,比如微博平台上各类数据的规模。
全部评论 (0)
还没有任何评论哟~


