
关于利用Word2Vec进行微博文本分类的研究
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本研究探讨了运用Word2Vec模型对微博文本数据进行特征提取和向量化表示,并基于此开展文本分类的应用探索。
微博等社交平台在信息时代已成为人们不可或缺的交流工具。挖掘这些平台上文本数据中的信息对于自动问答、舆情分析等领域具有重要意义。短文本分类研究是短文本数据分析的基础之一,而基于神经网络的Word2vec模型能够有效解决传统方法中存在的高维稀疏和语义鸿沟问题。
本段落首先利用Word2vec模型获取词向量,并引入类别因素改进传统的TF-IDF权重计算方法以设计新的词向量权重。之后通过加权求和的方式得到短文本的整体表示,最后采用SVM分类器进行训练并使用微博数据验证了该方法的有效性。
全部评论 (0)
还没有任何评论哟~


