
基于word2vec词向量的训练,以及中文文本相似度计算的实现(包含源码和语料)。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
该资源的核心内容主要来源于我个人的博客,网址为word2vec词向量训练及中文文本相似度计算http://blog..net/eastmount/article/details/50637476。其中包含了C语言的Word2vec源代码,该源代码可从官方网站下载,并涉及了自定义爬取的三大百科:百度百科、互动百科和维基百科的中文语料库。此外,资源还涵盖了60M的腾讯新闻语料,以txt格式存储,每行数据对应一篇新闻报道。 针对国家这一主题,提供了Python的Jieba分词代码示例,详细代码请参考博客中的相关说明。我们希望此免费资源能够对您的学习和实践有所裨益。
全部评论 (0)
还没有任何评论哟~


