Advertisement

训练数据集和测试数据集来自train-images-idx3-ubyte.gz和train-labels-idx1-ubyte.gz。

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
该页面可供获取的MNIST手写数字数据集包含60,000个样本用于训练,以及10,000个样本用于测试。它构成的是美国国家标准与技术研究院(NIST)提供的更为庞大的数据集的一个子集。这些数字图像已经按照统一的尺寸进行了标准化处理,并且以固定尺寸的图像为中心进行调整。对于那些希望在真实数据上探索学习技术和模式识别方法,同时又希望尽可能地减少预处理和格式化工作的人来说,这是一个非常理想的数据集。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • train-images-idx3-ubyte.gz train-labels-idx1-ubyte.gz
    优质
    这段数据包含了用于机器学习模型训练的基本图像及其标签。具体而言,train-images-idx3-ubyte.gz文件存储了灰度图像的像素值,而train-labels-idx1-ubyte.gz则对应地提供了每个图像的分类标签。这两部分是构建及验证神经网络等算法时不可或缺的基础资料。 MNIST手写数字数据库包含一个60,000个示例的训练集和一个10,000个示例的测试集。它是NIST提供的更大集合的一个子集。这些数字已经被标准化尺寸,并在固定大小的图像中居中显示。对于那些希望使用实际数据来尝试学习和技术模式识别方法,同时尽量减少预处理和格式化工作的人来说,这是一个很好的数据库选择。
  • train-images-idx3-ubyte.gztrain-labels-idx1-ubyte.gz
    优质
    这是MNIST数据集中的两个文件,包含手写数字图像及其标签。这些资源常用于训练和测试机器学习算法在图像识别任务上的表现。 train-images-idx3-ubyte.gz, train-labels-idx1-ubyte.gz, t10k-images-idx3-ubyte.gz, t10k-labels-idx1-ubyte.gz
  • ILSVRC2012-img-train
    优质
    ILSVRC2012-img-train是ImageNet大规模视觉识别挑战赛2012年的图像训练子数据集,包含约120万张图片,用于训练深度学习模型进行图像分类。 caffe_ilsvrc12.tar.gz 为 17MB;ILSVRC2012_img_train.tar 大小为 137.74GB;ILSVRC2012_img_val.tar 的大小是 6.28GB。
  • 划分为test、trainval以利于模型
    优质
    本项目介绍如何将数据集合理划分为测试集(test)、训练集(train)与验证集(val),旨在优化机器学习模型的性能与泛化能力。 划分数据集以便于模型训练时使用。可以将数据集分为test、train和val三个部分,并直接在代码内修改路径以方便使用。
  • cifar2包括testtrain部分
    优质
    CIFAR-2数据集包含了测试与训练两大部分,为图像分类任务提供了基础的数据支持,适用于各类机器学习模型的训练与评估。 本资源包含训练集和测试集。
  • 头条中文新闻/验证/)toutiao_cat_data.(train/dev/test).txt
    优质
    该数据集包含大量中文新闻文章,按类别划分,并分为训练、验证和测试三个子集,用于文本分类模型的开发与评估。 头条中文新闻数据集已经按照8:1:1的比例划分为训练集、测试集和验证集,并将格式整理为“新闻内容 + \t + 新闻标签 + \n”的形式,可以直接在AI Studio上使用这些数据来训练模型。
  • t10k-images-idx3-ubyte-MNIST.zip
    优质
    t10k-images-idx3-ubyte-MNIST数据集.zip包含手写数字图像,用于机器学习和模式识别研究,是训练算法识别数字的标准资源。 MNIST公开数据集包含训练集和测试集,已经划分好。训练集有50000个样本,测试集有10000个样本。
  • 包含的TE.zip
    优质
    本资料包提供了一个用于文本挖掘或自然语言处理研究的TE数据集,内含详细的训练集与测试集划分,便于模型开发与验证。 TE数据集是目前故障诊断领域常用的数据库之一。它由训练集和测试集两部分组成,整个TE数据集中包含22次不同的仿真运行结果的数据,每个样本有52个观测变量。d00.dat至d21.dat构成了训练集的样本段落件,而d00_te.dat到d21_te.dat则是用于测试的样本段落件。其中,d00.dat和d00_te.dat代表的是正常操作条件下的数据。 具体来说,d00.dat是通过运行25小时仿真的方式获取的数据,总共包含500个观测点;而d00_te.dat则是在48小时仿真环境下获得的测试样本段落件,该文件共记录了960个观测值。
  • LCQMC,涵盖、验证
    优质
    LCQMC数据集是一款专为中文语境设计的机器阅读理解与问答任务的数据集合,包含全面的训练集、验证集及测试集,旨在促进自然语言处理技术的发展。 LCQMC数据集包含训练集、验证集和测试集问题语义匹配数据集,其目标是判断两个问题的语义是否相同。