
该数据集是NLPCC2016的,主要包含新闻报道。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
该数据集与广泛应用于NLP研究的其他数据集,例如NLPCC2016以及一些流行的实时新闻数据集,存在显著差异。它主要包含大量来自新浪微博的非正式文本数据,这些文本的特点是更加口语化和自然。同时,为了方便研究人员的使用,该数据集也提供了包含数据集内容的两个文件:datasets.txt 和 datasets.zip。
全部评论 (0)
还没有任何评论哟~


