Monkey数据集（来自monkey.org）

5星

浏览量: 0

大小:None

文件类型：None

简介：
Monkey数据集是由monkey.org提供的一个用于软件测试的数据集合，旨在帮助开发者发现并修复软件中的各种缺陷和问题。 monkey.org上的数据比较杂乱，需要将其分开并进行分类处理。

全部评论 (0)

还没有任何评论哟~

客服

Monkey数据集（来自monkey.org）

优质

Monkey数据集是由monkey.org提供的一个用于软件测试的数据集合，旨在帮助开发者发现并修复软件中的各种缺陷和问题。 monkey.org上的数据比较杂乱，需要将其分开并进行分类处理。

elo-merchant-category-recommendation 数据集（来自 Kaggle）

优质

Elo-Merchant Category Recommendation数据集来源于Kaggle平台，旨在通过用户交易记录预测最有可能进行下一次交易的商户类别，促进个性化推荐和客户参与度。 Elo Merchant Category Recommendation 是 Kaggle 上的一个竞赛数据集。该比赛旨在通过分析用户的交易记录来推荐合适的商家类别标签，以帮助信用卡公司 Elo 提升客户体验并优化营销策略。参赛者需要利用提供的用户、交易等信息进行建模和预测，最终目标是为每个用户提供最相关的商户分类建议。

心脏疾病数据集（来自Kaggle）.zip

优质

该数据集包含心脏病患者的详细信息，用于研究和预测心脏病风险。内容涵盖患者年龄、性别、生活习惯及临床检查结果等多维度数据，适用于机器学习模型训练与评估。来源为Kaggle平台。心脏病数据集.zip

84168条来自新浪微博的数据集

优质

该数据集包含84168条新浪微博记录，旨在为研究社交媒体上的信息传播、用户行为及社会影响力分析提供真实可靠的数据支持。这段文字描述了一组微博数据集，包含8万多条在2014年5月3日至2014年5月11日期间采集的信息，涵盖了12个主题的内容。这些数据涉及63,641名用户，并且存储在一个SQL脚本段落件中，可以直接导入数据库使用。

Python中的乳腺癌数据集（来自sklearn.datasets.load_breast_cancer）

优质

这是一个包含乳腺癌患者医疗记录的数据集合，作为机器学习分类任务使用的经典数据集，可通过Python的sklearn库加载。乳腺癌数据集可以通过Python中的`sklearn.datasets`模块加载，使用命令`from sklearn.datasets import load_breast_cancer`。这个数据集常用于机器学习任务中，特别是在分类算法的训练与测试阶段。通过该库导入的数据包含了有关肿瘤特性的详细信息以及是否为恶性肿瘤的目标变量。

FB2M数据（来自Freebase）

优质

FB2M数据集来源于知识库Freebase，它包含了丰富的实体与多样的关系类型，广泛应用于大规模图神经网络的研究和训练中。 freebase-FB2M数据 freebase-FB2M数据 freebase-FB2M数据

CK+数据集下载链接（来自百度网盘）

优质

CK+数据集提供丰富的情感面部图像资源，涵盖多种表情与年龄跨度，适用于情感分析研究和人脸识别技术开发。现可从百度网盘免费获取。该数据库是在Cohn-Kanade Dataset的基础上扩展而来的，并于2010年发布。相比JAFFE，这个数据库规模更大。它包含123个参与者（subjects）和593张图像序列（image sequence），每一张序列的最后帧都有动作单元标签（action units label）。在这593个图像序列中，有327个序列还带有情感标签（emotion label）。该数据库在人脸表情识别领域非常流行，并且许多研究文章都使用它进行测试。

Spark Streaming与HBase集成：存储来自Kafka的数据

优质

本文介绍了如何将Apache Spark Streaming与HBase结合使用，实现高效地从Kafka实时接收数据并将其存储到HBase中。 SparkStreaming_HBase将从Kafka收集的数据保存到HBase中，数据来源为日志生成器。编写一个Python工程用于产生行为日志：每次运行会生成设定数量的日志记录，并通过Linux定时器每60秒执行一次，产生的行为日志会被保存在文件里。使用Flume来收集新产生的行为日志，再利用Kafka进行数据的收集和存储；然后用SparkStreaming实时处理这些数据，最后将结果写入HBase中。数据格式如下： ``` 63.132.29.46 2019-10-15 00:36:16 GET /class/131.html HTTP/1.1 404 - 46.98.10.132 2019-10-15 00:36:16 GET /class/112.html HTTP/1.1 200 - 46.29.167.10 2019-10-15 ```

GSE7828数据文件（来自NCBI数据库）

优质

GSE7828是存于NCBI基因表达综合数据库中的一个数据集，包含多项针对小鼠模型的研究实验的数据，主要用于探究特定条件下的基因表达变化。 Microarray数据（包括原始数据和处理后的数据）已存放在国家生物技术信息中心（NCBI）的基因表达 omnibus (GEO, GSE7828)中。

Ames Housing 数据集的探索性数据分析（来自 Kaggle 比赛）.zip

优质

本压缩文件包含针对Ames Housing数据集进行的探索性数据分析报告及代码。旨在通过细致的数据清洗、特征工程和可视化，为Kaggle比赛提供深入洞察与模型构建基础。 Ames 住房数据集（De Cock 2011）是学习我们将要在整个项目中使用的模型的绝佳资源。它包含了爱荷华州艾姆斯市2,930处房产的数据，包括与房屋特征、位置、地块信息、状况和质量评级以及售价相关的列。Arie 将提供有关探索性数据分析（EDA）的详细信息，并使用 R 编程语言从数据可视化中获得洞察力。我们将利用 R 编程语言对来自 Kaggle 比赛的 Ames 住房数据集进行探索性数据分析，相关可视化内容将在 Arie 提供的网页上展示。

是否确定退出登录?

Monkey数据集（来自monkey.org）

全部评论 (0)