
复旦大学中文文本分类数据集.zip
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
该数据集为复旦大学提供的中文文本分类资源,包含多个类别、大量标注样本,适用于训练和评估文档自动分类算法。
本语料库由复旦大学李荣陆提供。test_corpus.rar包含9833篇测试文档;train_corpus.rar则有9804篇训练文档,两个语料集各分为20个相同类别。训练数据与测试数据基本按照1:1的比例划分。(使用时请尽量注明资料来源(复旦大学计算机信息与技术系国)。)
全部评论 (0)
还没有任何评论哟~


