
基于GPT2的详注中国新闻标题生成项目
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本项目采用GPT-2模型,致力于开发能够自动生成详尽注释的中文新闻标题系统,增强信息透明度与理解力。
GPT2-新闻标题带有超详细注释的GPT2新闻标题生成项目更新日期为01.02.2021。该项目从网上收集了包括清华、搜狗等在内的多个新闻数据集,以及一些开源摘要数据,并进行了整理和清洗工作,制作了一个较为完善的中文摘要数据集。
在进行数据清理时,仅采用了简单的规则清洗方法。例如:去除了html标记、多余的空字符及图片标记等内容。
处理后的详细信息请参见原始数据文件或项目地址中的相关文档。清华新闻数据的提取码为vhol;搜狗新闻的数据提取码为ode6;nlpcc2017摘要数据的提取码是e0zq,csl摘要数据的提取码则是0qot;教育培训行业的摘要数据则使用kjz3作为其对应的下载代码。
全部评论 (0)
还没有任何评论哟~


