
MATLAB 10折交叉验证的KNN代码,用于分类算法项目。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
该项目旨在对一系列分类器进行评估,基于以下内容:分类器的准确性、敏感性和特异性。所使用的数据集来源于乳腺癌数据库,可以查阅到。以下是快速的概述:数据集包含699个实例,每个实例都拥有两种可能的类别之一——良性(占65.5%)或恶性(占34.5%),分别用数字2和4表示,稍后用-1和1替换。每个实例还包含9个按[1-10]比例缩放的属性以及一个类标签。为了处理缺失的属性(总共16个),这些属性值被替换为最常见的对应值。在此项目中评估的分类器包括贝叶斯概率分类器,它通过分析实例所拥有的属性值来估计该实例最有可能属于哪个类别,并为其分配相应的类标签。此外,先验概率根据data-description.txt设定,将良性和恶性分别设置为0.655和0.345,用于选择K最近邻居。在进行分类时,如果出现平局情况,则采用最接近级别的方案来打破领带。为了优化性能,训练集大小的平方根被选为k值。通常情况下,较大的k值有助于减少噪声对分类结果的影响,但可能会使类别之间的边界变得不那么清晰。最后, 为了使距离较近的邻居比距离较远的邻居对分类结果贡献更多, 引入了邻居效应。
全部评论 (0)
还没有任何评论哟~


