
使用 PyTorch-Transformers 的 BERT 中文文本分类代码实现
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
这段简介描述了一个基于PyTorch-Transformers库进行BERT模型中文文本分类的具体代码实现。通过该实现,可以高效地处理和分析中文文本数据,适用于多种自然语言处理任务。
基于 pytorch-transformers 实现的 BERT 中文文本分类代码使用了 THUCNews 数据集中的20万条新闻标题进行训练、验证和测试。这20万条数据涵盖了10个类别:财经、房产、股票、教育、科技、社会、时政、体育、游戏和娱乐,每个类别的数量为2万条。
这些数据被分为三部分:
- 训练集包含18万新闻标题,每种类别有18,000条;
- 验证集包括1万个新闻标题,每种类别含1,000条;
- 测试集也由同样数量的1万个新闻标题组成,每个类别的数据量为1,000。
全部评论 (0)
还没有任何评论哟~


