
复旦大学中文文本分类训练语料库
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
简介:复旦大学中文文本分类训练语料库是由复旦大学自然语言处理实验室开发的一个大规模中文文档分类数据集,包含多个主题类别和大量标注样本,适用于研究与开发基于深度学习的文本分类模型。
该语料库由复旦大学李荣陆提供,包含两个压缩文件:test_corpus.rar 和 train_corpus.rar。测试语料共9833篇文档;训练语料共有9804篇文档,两类资料各自分为20个相同类别。训练和测试数据按照大致1:1的比例进行划分。使用时应注明引用来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。
全部评论 (0)
还没有任何评论哟~


