Advertisement

机器学习使用27个常用的数据集。

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
该资源集包含27个广为使用的机器学习数据集,其中包括iris、bank、airline、soybean、weather以及credit等经典数据集,此外还涵盖了unbalanced等数据集。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • 27
    优质
    本资料整理了涵盖广泛领域的27个常用机器学习数据集,适用于初学者与进阶者进行模型训练和算法测试。 本段落介绍了27个常用的机器学习数据集,包括iris、bank、airline、soybean、weather、credit和unbalanced等。
  • 简易
    优质
    本数据集专为初学者设计,包含一系列简化的真实世界问题样本,旨在帮助使用者快速上手并理解机器学习算法的应用。 Data repository for seaborn examples. This is not a general-purpose data archive. This repository exists only to provide a convenient target for the `seaborn.load_dataset` function to download sample datasets from, making it easy to document seaborn.
  • (Iris、Wine、Abalone)
    优质
    本资源介绍了三种常用的机器学习数据集:鸢尾花(Iris)、葡萄酒(Wine)和鲍鱼(Abalone),适用于分类与回归任务。 这段文字描述了一些常用的机器学习数据集,格式均为CSV。其中包括iris.csv、wine.csv、abalone.csv以及glass.csv,总共有11个数据集。
  • 资源下载
    优质
    本页面提供了多种机器学习领域内的经典与最新数据集免费下载链接,涵盖分类、回归、聚类等任务类型,适合初学者和研究人员使用。 机器学习的常用数据集资源可以方便地进行下载。
  • 葡萄酒_Wine_一些整理
    优质
    《葡萄酒数据集》(Wine Dataset)是一套广泛应用于机器学习领域的经典分类数据集,包含178个酒样本,每个样本有13个不同的化学成分属性值,用于训练算法识别不同类型的葡萄酒。 包括鸢尾花数据、葡萄酒数据以及心脏病数据在内的多种数据集被使用。
  • 各种格式二分类
    优质
    本数据集包含多种常用的二分类问题的数据集,适用于训练和测试各种机器学习算法模型。适合初学者实践与研究使用。 各种格式的机器学习常用的二分类数据集有很多,但由于文件大小限制无法上传,请直接联系我获取更多信息。
  • 笔记2:使sklearn探索iris
    优质
    本篇笔记介绍了如何利用Python的scikit-learn库进行Iris数据集的加载、预处理及初步分析,帮助初学者掌握基本的数据探索方法。 本段落使用scikit-learn开源机器学习库对iris数据集进行分类练习,并将分别采用两种内置算法——决策树(DecisionTree)与k近邻算法(kNN)。此外,我还将尝试自行实现kNN算法。目前我的学习仍处于初级阶段,在此文中不会详细解释相关算法原理,若需深入了解细节,请查阅其他资料。 scikit-learn库中包含了许多经典的数据集供使用者练习使用。加载iris数据集的方式十分简便: load_iris函数返回的结果包括如下属性:feature_names(分别为sepal等特征)。
  • 合:包含多合,供使
    优质
    这是一套精心准备的多元数据集合,内含多个不同领域的数据集,旨在为研究者和学生提供便捷的学习与分析资源。 该存储库包含了用于介绍元数据集的文章的相关代码,并且也包括了CrossTransformers的配套代码和检查点。这些内容是基于文章//arxiv.org/abs/2007.11498的工作,旨在提高性能的表现。这里提供的代码是为了提供有关数据供给管道、我们的框架与模型以及实验设置实施细节的信息。 以下是关于软件、数据及实现模型的说明。同样地,也可以在此处找到如何从管道(片段或批次)中采样数据的演示示例。为了运行arXiv文章第一版描述中的实验,请使用该存储库版本上的指导文件、代码和配置文件来操作。我们正在更新相关指令、代码及配置文档以支持在第二版论文结果的重现工作。
  • 在聚类分析、挖掘中
    优质
    本论文探讨了常用数据集在聚类分析、机器学习和数据挖掘领域的应用情况,旨在通过实例展示各类算法和技术的有效性与局限性。 在聚类分析、机器学习和数据挖掘领域常用的数据集包括UCI的wine、yeast、iris等数据集以及USPS数据集、4k2_far、leuk72_3k数据集等。