
中文预训练词向量数据集(基于百度百科的word2vec和Ngram)
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本数据集提供基于百度百科内容训练所得的中文Word2Vec与N-gram模型词向量,适用于自然语言处理任务中语义理解的提升。
中文预训练词向量“chinese-word-vectors”是由北京师范大学中文信息处理研究所与中国人民大学DBIIR实验室的研究者开源的。此中文预训练词向量基于百度百科Word + Ngram模型,可以直接从GitHub下载。
全部评论 (0)
还没有任何评论哟~


