
轮廓系数和互信息等指标,利用Python评估ML算法的聚类效果。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
优秀的聚类算法应具备高类内凝聚度和高类间分离度。本文详细阐述了两种聚类评估方法,即轮廓系数(Silhouette Coefficient)和标准化互信息(NMI),并提供了Python代码示例以供参考。此外,我们引用了中国科学院计算技术研究所周昭涛硕士论文《文本聚类分析效果评价及文本表示研究》第三章中“聚类算法初探”的内容,作为评估的参考。为了帮助读者更好地理解聚类评估,建议首先查阅原文,以便获得更全面的认识。总而言之,我们力求最终的聚类结果能够体现同一簇内点之间的紧密关联,以及不同簇之间距离的显著性差异,同时确保其与人工判断结果保持一致性。随后将介绍两种聚类的评估方法...
全部评论 (0)
还没有任何评论哟~


