
KNN分类算法:数据挖掘的简易工具
5星
- 浏览量: 0
- 大小:None
- 文件类型:PDF
简介:
KNN(k-近邻)分类算法是一种简单而直观的数据挖掘技术,适用于处理分类问题。通过测量不同特征值之间的距离进行分类预测,无需假设数据具有特定分布形式。
邻近算法或K最近邻(kNN, k-Nearest Neighbor)分类方法是数据挖掘中最简单的分类技术之一。所谓K最近邻,即指每个样本可以通过其最接近的k个邻居来定义。
kNN的核心思想在于:如果一个样本在特征空间中与它距离最近的k个样本大多数属于某一类别,则该样本也归为这一类,并具有同类别的属性特点。这种方法确定分类决策时仅依据最近的一个或几个邻近样本来决定待分类别,因此,在确定分类上只依赖少数相邻样本。
由于kNN主要根据周围有限数量的邻居来判断所属类别,而不是通过划定不同类别的区域来进行判定,所以对于那些各类别之间交叉重叠较多的情况来说,kNN方法更为适用。
全部评论 (0)
还没有任何评论哟~


