Advertisement

人民日报(北京大学)语料库

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
《人民日报》(北京大学)语料库是由北京大学构建的一个基于《人民日报》文章的大规模语言数据集合,为自然语言处理研究提供丰富的汉语资源。 分词训练语料库仅用于学习和研究目的,不得用于商业用途。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • 优质
    《人民日报》(北京大学)语料库是由北京大学构建的一个基于《人民日报》文章的大规模语言数据集合,为自然语言处理研究提供丰富的汉语资源。 分词训练语料库仅用于学习和研究目的,不得用于商业用途。
  • 中文系《》199801-199806数据集.rar
    优质
    该资源为北京大学中文系提供的《人民日报》1998年1月至6月的数据集,包含当时期内报纸的全部内容,以研究和教学为目的。 PFR人民日报标注语料库(版本1.0)是在获得人民日报社新闻信息中心许可的情况下制作的,该语料库基于1998年《人民日报》的数据,并由北京大学计算语言学研究所与富士通研究开发中心有限公司共同完成。为了推动中文信息处理的研究进展,三方计划公开PFR语料库。从4月3日起,在他们的官方网站上将免费提供PFR语料库一月份的资料供公众下载使用。 关于制作规范,请参考《现代汉语语料库加工——词语切分与词性标注规范》。如果在研究或论文中引用了该数据库,应注明其出处。
  • 中文分词
    优质
    人民日报中文分词语料库是由人民日报社提供的大规模语料资源,包含丰富的文本数据和详细的词汇标注信息,旨在支持自然语言处理技术的研究与开发。 人民日报1998年1月份的语料库已加入词性标注,并由北京大学开发,是进行中文分词统计的好资料。
  • 1998年全文
    优质
    1998年《人民日报》全文语料库收录了当年该报所有文章,涵盖新闻、评论等各类文本,是研究中国1998年度政治、经济和社会发展的重要资源。 1998年《人民日报》语料库可用于中文分词、词频统计等自然语言处理领域。
  • 2014年(完整版)
    优质
    《人民日报2014年语料库》收录了该年度人民日报全部文章,涵盖政治、经济、文化等多个领域,是研究当年社会动态和政策导向的重要资料。 人民日报2014年语料库文件较多且较大,已经整合成压缩包形式。需要的用户可以下载后解压使用。
  • 2014年.zip
    优质
    该文件包含《人民日报》在2014年的全部语料数据,内容涵盖当年国内国际重大事件、社会热点等,是研究当年时政和社会情况的重要资料。 2014年的《人民日报》数据共有28万行,可以直接用于词性标注训练,并且经过处理后也可以用来构建实体识别模型。
  • (一月份)
    优质
    北京大学语料库项目致力于收集、整理和研究汉语语言数据,以支持学术研究与教学活动。本简报展示了一月份项目的最新进展和成果。 自然语言处理,命名实体识别语料库,分词测试仅用于研究学习目的,严禁商业使用。
  • ——数据集更新通知
    优质
    本数据集为人民日报语料库的定期更新版本,包含最新的新闻文章和评论,旨在支持自然语言处理研究与应用。 这个语料库自带分词功能。
  • 1998年的标注
    优质
    该文档为人民日报在1998年时期的新闻报道及文章集合,经过人工处理和标注,是中文自然语言处理领域中具有代表性的训练数据资源。 对自然语言处理感兴趣的同学们可以下载人民日报1998年一月份的带标注语料来训练模型。
  • 1998年1月中文注释
    优质
    《人民日报1998年1月中文注释语料库》是一部收集了1998年1月份《人民日报》所有文章并配有详细注释的大型数据库,为语言研究和文本分析提供了宝贵的资料。 人民日报标注语料库(版本1.0)是在获得人民日报社新闻信息中心许可的情况下制作的。该语料库基于1998年《人民日报》的内容,由北京大学计算语言学研究所与富士通研究开发中心有限公司共同完成。它对超过600万字节的中文文章进行了分词和词性标注,并被广泛应用于各种研究和论文中作为原始数据。