
基于Cart分类树的二维空间鸢尾花分类(利用sklearn库)
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本研究运用Python的sklearn库,采用Cart分类树算法对鸢尾花数据进行二维空间分类分析,旨在提升模型在复杂多类问题上的预测精度。
1. 数据集的获取:使用SCIKIT-LEARN中的鸢尾花数据集,并从中选取后两个特征及其对应的类别标签。
2. 最小包围盒与数据划分:
(1) 获取包含所有样本点在二维空间内的最小矩形范围[x1_min, x1_max]*[x2_min,x2_max],并记录这些参数值。
(2) 根据鸢尾花类别的标签信息对整个数据集进行分层随机打乱处理。然后采用hold-out法将样本分为训练集(占80%)和测试集(占20%)。
3. 模型学习:利用上述划分的训练子集,分别构建两个复杂度不同的CART分类树,并通过可视化展示这两个模型的学习结果。
4. 测试与评价:
(1) 依据测试集中每个样本的真实类别标签与其预测值生成混淆矩阵并进行视觉化呈现。
(2) 利用该混淆矩阵来计算各类别的精确率、召回率及F1分数,同时也评估出宏平均的精度、召回和F1分,并且给出模型的整体准确度评价。
5. 应用分类树:
(1) 在原始数据集所覆盖的空间基础上稍作扩展形成新的矩形区域[x1_min-1, x1_max+1]*[x2_min-1,x2_max+1],然后在此范围内以0.02为间隔生成一系列离散的网格点。
(2) 对于每一个这样的网格点都当作一个新的待分类样本进行处理,并利用之前训练好的CART模型来预测它们所属类别。
全部评论 (0)
还没有任何评论哟~


