
复旦大学中文文本的分类训练集与测试集
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本数据集包含复旦大学整理的中文文档分类训练及测试样本,适用于自然语言处理领域中主题分类任务的研究和模型开发。
复旦大学中文文本分类训练集和测试集包含在all文件夹内,该文件夹包含了复旦大学的中文文本分类语料库。其中,test_corpus是从整体语料集中挑选出的一部分,并被划分为测试数据;train_corpus则是剩余部分的数据集合,作为训练数据使用。下载后可以根据自己的需求指定比例来划分训练集和测试集,也可以选择按照文档中给出的方法进行划分。
全部评论 (0)
还没有任何评论哟~


