
K均值聚类算法的原理,以及Python如何应用于其实现。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
第一步,我们通过随机生成质心来初始化算法。鉴于此为一种无监督学习方法,首先在二维坐标轴上,我们随机选取一组数据点,并随即确定两个质心。算法的核心目标是根据这些数据点的自身坐标特征,将它们划分为两类,因此选择两个质心至关重要。当这组数据点能够根据这两个质心被成功地分割成两组时,即为理想状态,如所示。第二步,基于距离进行分类操作。红色和蓝色标记分别代表我们先前随机选取的两个质心。为了确保每一组被分出的点都尽可能地靠近其对应的质心,我们首先需要计算每个数据点与质心的距离。如果一个点离红色质心的距离小于离蓝色质心的距离,那么该点将被归类为属于红色质心所属的那一类;反之,则会被归类为属于蓝色质心所属的那一类,具体情况见下图所示。第三步,计算同一类别内点的均值并更新质心。
全部评论 (0)
还没有任何评论哟~


