
k-均值聚类算法及其Matlab代码,应用于数据挖掘。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
k-means聚类算法以及配套的MATLAB代码,用于数据挖掘实验,实验一旨在探索相似度、距离以及最近邻分类器的相关概念。首先,实验目的在于深入理解相似度与距离的量化方法。其次,实验内容包括:(1) 编写一个函数,能够计算任意两个具有相同维度的向量之间的欧氏距离,该函数定义为function dist = dist_E(x, y)。(2) 进一步编写一个函数,用于计算任意两个相同维度的向量之间的夹角余弦相似度,该函数定义为function sim = sim_COS(X, Y)。(3) 实现K最近邻算法(KNN算法),其核心思想是输入参数包括:k值、训练数据集(MN矩阵,M代表样本数量,N代表属性数量)、训练数据集的分类标签矩阵(M1矩阵),以及测试数据(1*N矩阵)。算法流程如下:首先获取训练数据集trainingSamples的大小M和N;随后初始化一个Distance数组(M*1),用于存储每个训练样本与测试样本之间的距离。然后,对于每一个训练样本trainingSamples(i,:),计算其与测试样本之间的距离并存储到Distance数组中。
全部评论 (0)
还没有任何评论哟~


