
基于鸢尾花数据的可视化及Sklearn库中SVM和LR模型的训练与评估(含ROC和P-R曲线).zip
5星
- 浏览量: 0
- 大小:None
- 文件类型:ZIP
简介:
本项目使用Python的Sklearn库对鸢尾花数据集进行支持向量机(SVM)和逻辑回归(LR)模型的训练,并通过绘制ROC及P-R曲线来评估模型性能。
在机器学习领域,“鸢尾花”是指一个经典的多类分类问题的数据集,称为“Iris dataset”或“安德森鸢尾花卉数据集”。这个数据集最早由英国统计学家兼生物学家罗纳德·费雪于1936年收集并整理发表。它包含了150个样本观测值,对应三种不同类型的鸢尾花(Setosa、Versicolor、Virginica),每种类型各包含50个样本。
每个样本有四个特征:
萼片长度
萼片宽度
花瓣长度
花瓣宽度
这些特征都是连续数值型变量。目标变量则是每一朵花所属的类别。由于数据量适中且易于理解,鸢尾花数据集常被用作新手入门机器学习算法时的第一个实践项目,并适用于多种监督学习算法,如逻辑回归、K近邻(KNN)、支持向量机(SVM)、决策树以及各种集成方法等。
全部评论 (0)
还没有任何评论哟~


