
Chinese-Word-Vectors:上百种预训练的中文词向量 (100+)
5星
- 浏览量: 0
- 大小:None
- 文件类型:ZIP
简介:
Chinese-Word-Vectors是一个包含上百种预训练模型的资源库,专门用于生成高质量的中文词向量,助力自然语言处理任务。
该项目提供了超过100个中文单词向量(嵌入),这些向量经过不同表示形式(密集型与稀疏型)以及不同的上下文特征(包括词、n-gram、字符等)在各种语料库中进行训练后生成的。用户可以轻松获取具有不同属性的预训练向量,并将其应用于下游任务。
此外,我们还提供了一个中文类比推理数据集CA8和一个评估工具包,帮助用户对其单词向量的质量进行全面评估。
参考文献:
如果使用这些嵌入及CA8数据集,请引用该论文。沉力、赵哲、胡仁芬、李文思、刘涛以及杜小勇在ACL 2018上的相关研究。
@InProceedings{P18-2023,
author = {Li, Shen and Zhao, Zhe and Hu, Renfen and Li, Wensi and Liu, Tao and Du, Xiaoyong},
title = {Analogical Reasoning on Chinese M}
全部评论 (0)
还没有任何评论哟~


