
基于Word2vec词嵌入的Text-CNN中文文本分类
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本研究采用Word2vec模型进行词嵌入,并结合Text-CNN架构对中文文本进行自动分类,有效提升分类精度与效率。
本段落是在参考了gaussic大牛的“text-classification-cnn-rnn”之后进行的一项实验研究,在相同的数据集上进行了基于词级别的CNN文本分类操作,并使用Word2vec训练词向量嵌入。相较于原版,本项研究做出了以下改进:
1. 引入不同大小的卷积核;
2. 添加了正则化机制;
3. 移除了纯中文或英文单词中的数字、符号等非字母字符;
4. 去掉了长度为一的所有词。
经过上述调整后,实验结果得到了显著提升。验证集准确率从最初的96.5%提高到了97.1%,测试集的准确性也由原来的96.7%上升至了97.2%。
本研究的主要目的在于探讨使用Word2vec训练出的词向量嵌入CNN模型后对分类效果的影响,最终实验得出的结果显示,在验证集中该方法能够达到97.1%的准确率。
全部评论 (0)
还没有任何评论哟~


