
聚类数据挖掘伪代码示例
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本文章提供了多种常用的聚类算法的数据挖掘伪代码示例,旨在帮助读者理解和实现复杂的聚类技术。
在DIANA算法的示例过程中,第一步是确定具有最大直径的簇,并计算该簇内每个点之间的平均欧氏距离。例如:
- 点1与其他各点间的平均距离为(1+1+1.414+3.6+4.24+4.47+5)/7=2.96
- 类似地,其他各个点的计算结果分别为:点2为2.526;点3为2.68;点4为2.18;点5为2.18;点6为2.68;点7为2.526;点8为2.96。
根据这些数据,选取平均相异度最大的那个作为初始的splinter group(分裂组),即选择的是包含点1。剩余所有其他节点形成old party(原簇)。
接下来按照如下步骤操作:
- 第二步:从old party中找到距离最近的splinter group中的一个点的距离不大于到other old party中最近的一个点的距离,这个规则被用来确定下一个加入分裂组的元素,即这里选择的是点2。
- 第三步:重复第二部的操作,这时将点3添加到了splinter group中。
- 第四步:继续执行以上步骤,在此过程中又加入了新成员——点4进入splinter group。
当不再有符合条件的新节点可以加入到分裂组时(即所有的旧簇中的元素都已经被分配),或者满足了终止条件(如k-2,其中k代表预先设定的参数值或目标数量),整个过程就结束了。如果尚未达到预设的终止标准,则需要继续从已经完成一次分裂操作的最大直径簇中选取下一个要处理的目标进行进一步分割。
全部评论 (0)
还没有任何评论哟~


