Advertisement

关于MNIST格式的垃圾邮件数据集

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
这是一个专为识别垃圾邮件设计的数据集合,基于著名的MNIST手写数字数据集结构。此数据集用于训练和测试机器学习模型以有效区分合法电子邮件与垃圾信息。 文件包含四个部分:训练集图像(train_images_idx3_ubyte)、训练集标签(train_labels_idx1_ubyte)、测试集图像(t10k_images_idx3_ubyte)以及测试集标签(t10k_labels_idx1_ubyte)。每个图像的尺寸为128*128。训练集中共有5000多张图片,其中ham类别约有2000张,spam类别约有3000张;而测试集包含超过1000张全部属于spam类别的图片。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • MNIST
    优质
    这是一个专为识别垃圾邮件设计的数据集合,基于著名的MNIST手写数字数据集结构。此数据集用于训练和测试机器学习模型以有效区分合法电子邮件与垃圾信息。 文件包含四个部分:训练集图像(train_images_idx3_ubyte)、训练集标签(train_labels_idx1_ubyte)、测试集图像(t10k_images_idx3_ubyte)以及测试集标签(t10k_labels_idx1_ubyte)。每个图像的尺寸为128*128。训练集中共有5000多张图片,其中ham类别约有2000张,spam类别约有3000张;而测试集包含超过1000张全部属于spam类别的图片。
  • TXT
    优质
    该数据集包含大量未经请求的、以TXT格式发送的垃圾邮件样本,用于研究和开发高效的反垃圾邮件过滤系统。 适合自然语言处理入门的学习者使用的垃圾邮件数据集。
  • 优质
    《垃圾邮件数据集》包含大量电子邮件样本,用于训练机器学习模型识别并过滤垃圾信息,帮助提高电子邮箱的安全性和用户体验。 中国教育和研究计算机紧急响应团队建立了垃圾邮件语料库。
  • Spambase.csv
    优质
    Spambase.csv 数据集包含了大量电子邮件特征及其是否为垃圾邮件的标签,用于训练分类模型识别和过滤垃圾信息。 实验数据集为垃圾邮件数据集(可从UCI机器学习库获取)。请从spambase.csv文件读入数据。该数据集的基本信息如下:样本数: 4601,特征数量: 57,类别:1代表垃圾邮件,0代表非垃圾邮件。
  • 分类
    优质
    本数据集包含大量电子邮件样本,旨在训练机器学习模型识别并过滤垃圾邮件。通过标签区分正常邮件与垃圾信息,助力提升用户体验和网络安全。 我们收集的非垃圾邮件来自归档的工作和个人电子邮件,因此,“乔治”一词和区域代码“650”表示这些是非垃圾邮件。在构建个性化垃圾邮件过滤器时,这些信息非常有用。人们要么必须掩盖此类非垃圾邮件指标,要么需要大量非垃圾邮件样本来生成通用的垃圾邮件过滤器。
  • 真实
    优质
    这是一个包含真实世界中的大量垃圾邮件实例的数据集合,旨在用于训练和测试垃圾邮件检测算法,促进电子邮件通信的安全与效率。 该数据集包含一系列邮件,适用于测试垃圾邮件过滤系统,请勿用作商业目的。
  • MNISTCSV
    优质
    这段简介可以描述为:关于MNIST数据集的CSV格式主要介绍如何将经典的MNIST手写数字识别数据集转换并使用CSV文件存储,方便编程语言读取和处理。 MNIST数据集及其csv格式可以用于Spark处理。csv格式是自己生成的。
  • MNISTCSV
    优质
    本简介探讨了MNIST数据集以CSV格式的应用与特点,方便用户进行手写数字识别的研究和模型训练。 MNIST数据集是一个用于手写识别的数据集,在机器学习的基础教学中非常常见,并且很多教程都使用它来进行分类训练和学习。
  • 电子信息
    优质
    该数据集包含了大量电子邮件样本,旨在帮助研究者检测和过滤垃圾邮件。通过标记是否为垃圾邮件,促进机器学习模型训练与评估。 包含中文邮件数据集和英文邮件数据集,内容丰富。由于数据集过大,在word文档中提供了获取这些数据集的步骤指引。
  • 电子信息
    优质
    本数据集收集了大量电子邮件样本,涵盖各种类型的垃圾邮件与正常邮件。通过机器学习算法训练模型识别并过滤垃圾信息,旨在提升用户体验和信息安全。 垃圾邮件数据集由dredze教授提供,属于开源的公共数据集,请勿用于商业目的。若在论文中引用,请标明出处。