
简历解析中的文本分类训练数据
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本项目专注于简历解析技术中用于训练模型的文本分类数据集构建与优化,旨在提高招聘效率和精准度。
可以训练的数据包括:1-基本信息 2-教育经历 3-工作经历 4-自我评价 5-项目经历,共包含169948份文档。数据集按照4:1的比例分为训练集和测试集。每条data记录由三部分组成:文档索引、词索引以及词频;label行号对应文档索引,其值为1至5分别表示该文档的分类;vacubulary行号代表词索引,对应的数值是具体的词汇内容。
全部评论 (0)
还没有任何评论哟~


