
使用Python和鸢尾花数据集绘制P-R曲线
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本教程详细介绍了如何利用Python编程语言及scikit-learn库中的鸢尾花数据集来构建并可视化分类模型的精确率-召回率曲线。通过此过程,学习者能够深入理解不同阈值设定下模型的性能表现,并掌握有效评估机器学习算法的关键技能。
#coding=utf-8
演示目的:利用鸢尾花数据集画出P-R曲线
print(__doc__)
import matplotlib.pyplot as plt
import numpy as np
from sklearn import svm, datasets
from sklearn.metrics import precision_recall_curve, average_precision_score
from sklearn.preprocessing import label_binarize
from sklearn.multiclass import OneVsRestClassifier
# from sklearn.cross_validation import train_test_split #适用于anaconda 3.6及以前版本
# from sklearn.model_selection import train_test_split #适用于anaconda 3.7
# 使用iris数据集,画出P-R曲线
iris = datasets.load_iris()
X = iris.data
y = iris.target
# 标签二值化,将三个类转为001, 010, 100的格式。因为这是个多类分类问题,后面将要采用OneVsRestClassifier策略将其转换成两类分类问题。
y = label_binarize(y, classes=[0, 1, 2])
n_classes = y.shape[1]
print(y)
全部评论 (0)


