
朴素贝叶斯文本分类所用数据集。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
朴素贝叶斯分类算法数据集的文本挖掘(Text Mining,即从文字内容中提取有价值的信息)是一个相当广泛的概念,并且随着当今每日产生海量文本数据的情况,这项技术日益受到重视。 借助机器学习模型的支持,包括情感分析、文件分类、主题分类、文本摘要以及机器翻译等诸多文本挖掘应用,都已经达到了自动化处理的程度。 在这些应用场景中,垃圾邮件过滤无疑是初学者实践文件分类的一个理想起点,例如 Gmail 账户中的“垃圾邮件”收件箱就体现了垃圾邮件过滤技术的实际应用。接下来,我们将基于一份公开的邮件数据集——Ling-spam,进行编写一个专门用于识别和过滤垃圾邮件的过滤器。 Ling-spam 数据集...
全部评论 (0)
还没有任何评论哟~


