
复旦大学中文文本分类语料(训练集)
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
该链接包含了训练数据集,测试集请参考我提供的资源本语料库,由复旦大学李荣陆老师提供。`test_corpus.rar`为测试语料,其中包含9833篇文档;`train_corpus.rar`为训练语料,共计9804篇文档,两个语料库均被划分成20个相同的类别。训练语料与测试语料的比例大致维持在1:1的平衡。在应用时,请务必标注其来源,感谢复旦大学计算机信息与技术系国际数据库中心自然语言处理小组的贡献。由于文件体积较大(训练和测试数据各约50兆字节),建议您在下载时保持耐心。
全部评论 (0)
还没有任何评论哟~


