Advertisement

包含6万条电子邮件的数据集。

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
包含着六万个电子邮件数据,这些邮件根据其内容被划分为垃圾邮件类别(spam)和正常邮件类别(ham),为贝叶斯分类器的学习提供了丰富的训练样本。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • 60000记录
    优质
    这是一个庞大的电子邮件数据集合,包含了六万条详细的邮件记录,为研究和数据分析提供了宝贵的资源。 有60000个电子邮件样本可供贝叶斯分类器学习使用,这些邮件被标记为垃圾邮件或正常邮件。
  • -
    优质
    本数据集包含大量电子邮件样本及其分类标签,适用于垃圾邮件检测、主题分类等应用场景的研究与开发。 电子邮件网络由邮箱作为节点,通过邮箱之间发送邮件形成的连接构成。
  • 优质
    电子邮件数据集是一系列用于训练和测试机器学习模型的数据集合,包含大量的邮件文本及分类标签信息。 机器学习实战读书笔记(四):介绍了朴素贝叶斯算法所用到的email数据集。
  • 10新闻
    优质
    这是一个庞大的数据集,内含十万篇新闻文章,为文本分析、情感分析和机器学习等应用提供了丰富的资源。 我们有一个包含98000多条新闻的数据集,涵盖了财经、房产、家居、教育、科技、社会、时政、体育、游戏和娱乐这十个分类。
  • 8微博
    优质
    这是一个庞大的微博数据集,包含了超过八万条用户原创的内容和评论,为社交媒体分析提供了宝贵的信息资源。 我们有8万多条微博数据,这些数据是在2014年5月3日至2014年5月11日期间收集的,涵盖了12个不同的主题。所有信息已整理为SQL脚本格式,方便直接导入数据库中使用。
  • 5影评豆瓣
    优质
    本数据集包含了来自豆瓣网站的五万余条电影评论,旨在为研究者提供一个全面且丰富的中文语料库,用于情感分析、主题建模等自然语言处理任务。 我收集了豆瓣5万条影评的原始数据集,欢迎大家下载并尊重我的劳动成果。如果有时间我会继续提供更多的数据集。对于从事机器学习、自然语言处理和深度学习的研究者来说,这个资源非常有用。数据格式为:电影名称##评论星级(1-5星)##评论内容。
  • 评论酒店
    优质
    本数据集收录了超过两万条关于酒店的评论,旨在通过分析顾客反馈来评估和改善酒店服务质量。 适合数据分析初学者进行简单的文本分类训练和文本情感分析。
  • 100评价京东
    优质
    本数据集汇集了超过百万条针对各类商品在京东平台上的用户评价,为研究消费者行为和市场趋势提供了宝贵资源。 数据共有100多万条,以下是数据的格式:产品编号、产品ID、评分、用户ID。
  • .rar
    优质
    电子邮件数据集.rar包含大量结构化和非结构化的电子邮件样本,适用于训练分类算法、语言模型及研究。 垃圾邮件分类数据集包含了用于识别和过滤垃圾邮件的各类电子邮件样本。这些样本经过仔细筛选和标记,能够帮助开发人员训练机器学习模型以提高对垃圾邮件的检测能力。该数据集广泛应用于研究领域,并且对于提升用户邮箱体验具有重要意义。