本Jupyter Notebook介绍如何使用SVM(支持向量机)进行手写数字识别,包含数据预处理、模型训练及评估等内容。
实验目的:
1. 掌握基于SVM算法构建手写数字识别模型。
2. 熟悉支持向量机算法的调用方法。
3. 了解支持向量机算法的主要参数。
建模流程:
在实验中,我们使用了支持向量机(SVM)来构建手写数字识别模型。通过加载数据集、划分训练集和测试集以及调整参数等步骤完成了整个建模过程。
模型参数理解:
我们在实验过程中了解到了SVM中常用的几个关键参数及其对模型性能的影响,包括核函数类型(如rbf、linear、poly及sigmoid)、正则化参数C和多项式核的阶数degree等。
新掌握的工具与方法:
在此次实验中,我们运用了Sklearn库中的多个重要功能与组件,例如SVC分类器、train_test_split数据划分工具以及cross_val_score交叉验证评估函数。此外还使用了roc_curve用于计算接收者操作特征曲线,并通过joblib.dump和joblib.load实现模型的保存与加载。
结论:
构建并优化手写数字识别模型的过程中发现其性能受到多种因素的影响,其中包括核函数的选择、正则化参数C的调节以及多项式阶数degree等。为了提高模型在未知数据上的泛化能力,我们需要综合考虑这些影响因子,并通过交叉验证等方式进行细致评估与调试。