
TX-WORD2VEC-MINI: 腾讯word2vec模型精简版
5星
- 浏览量: 0
- 大小:None
- 文件类型:ZIP
简介:
简介:TX-WORD2VEC-MINI是腾讯推出的词向量表示工具Word2Vec的简化版本,旨在提供轻量化且高效的中文文本语义分析解决方案。
腾讯开源了word2vec模型。
原版大小为15GB,一般爱好者难以运行。
因此制作了一些较小的版本供大家使用:
- 5000-small.txt:包含5000个词,适合初步尝试;
- 45000-small.txt:包含4.5万个词,能够解决许多问题;
- 70000-small.txt:包含7万个词,文件大小为133MB;
- 100000-small.txt:包含10万个词,文件大小为190MB;
- 500000-small.txt:包含50万个词,文件大小为953MB;
- 1000000-small.txt:包含1百万个词,文件大小为1.9GB;
- 2000000-small.txt:包含2百万个词,文件大小为3.8GB。
更大的版本需要自行下载。
如何使用:
读取模型
```python
from gensim.models import KeyedVectors
model = KeyedVectors.load_word2vec_format(50-small.txt)
```
接下来就可以开始探索和利用这个模型了。
全部评论 (0)
还没有任何评论哟~


