
中英文垃圾邮件分类数据集
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本数据集包含大量中英文垃圾邮件样本,旨在通过机器学习算法识别并过滤垃圾信息,提升用户体验。
有两个语料库——一个主要为英语(trec06p)和一个中文的(trec06c)。其中:
- trec06p/full/ 是理想反馈的英文语料库。
- trec06p/full-delay/ 是延迟反馈的英文语料库。
- trec06c/full/ 是理想反馈的中文语料库。
- trec06c/delay/ 是延迟反馈的中文语料库。
全部评论 (0)
还没有任何评论哟~


