
清华大学模式识别课程第二次作业。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
1. 仍旧利用第一次作业中获得的初始数据集,作为训练集使用,并严格限制样本数量在20至20例之间。该数据集采用身高和体重作为关键的特征变量,用于对性别进行分类,进而训练支持向量机(SVM)分类器。在测试数据集dataset1.txt上评估分类器的性能,并分别尝试线性核和高斯核函数,同时自行调整SVM模型的各项参数。 2. 借助一个更为庞大的数据集(dataset2.txt)作为训练样本,同样采用身高和体重这两个特征变量进行性别分类。在此基础上,假设数据服从正态分布,估算概率密度函数,并构建一个最小误差率的贝叶斯分类器,务必详细记录所得到的决策规则。随后将该分类器应用于dataset1.txt数据集上,计算并报告测试阶段的错误率。请根据自身判断灵活地选择合适的先验概率。3. 将收集到的样本数据以及在两次作业中获得的多个分类面图绘制成一个由身高和体重这两个维度构成的二维平面图。接下来,对这些数据进行深入的分析与讨论;此外,也可以在基本要求的基础上自主设计其他实验方案,并将所有实验结果整合在一起进行全面分析与总结。
全部评论 (0)
还没有任何评论哟~


