
头条中文新闻数据集的训练集、验证集和测试集为toutiao_cat_data.(train/dev/test).txt。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
头条中文新闻数据集(来源于GitHub仓库:https://github.com/aceimnorstuvwxz/toutiao-text-classfication-dataset)已经按照严格的8:1:1比例进行了划分,生成了包含训练集、测试集和验证集的三个子集。同时,数据集的格式也得到了精心的整理,以“新闻内容 + 制表符 (\t) + 新闻标签 + 换行符 (\n)”的形式呈现,这使得利用AI Studio进行模型训练变得异常便捷和直接。
全部评论 (0)
还没有任何评论哟~


