
Spark提供K-Means算法的代码示例。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
K-Means算法属于一种基于距离的聚类方法,它通过反复迭代的过程,确定出若干个聚类中心的坐标,并将大量的点划分成K个不同的类别。Apache Spark的MLlib库提供了K-Means算法的实现,其核心思想是执行多个独立的K-Means运行过程,每个运行过程被称为一个“run”,并最终返回能够代表最佳聚类的中心点。这些初始的中心点可以采用随机方式生成,也可以借助KMeans||算法的结果来确定。当迭代次数达到预设的限制,或者所有“run”过程都已收敛时,算法便会自然结束其运行。
全部评论 (0)
还没有任何评论哟~


