
lda2vec-pytorch:利用词向量做主题模型
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
lda2vec-pytorch 是一个基于 PyTorch 的库,它结合了词嵌入技术与主题建模方法LDA,用于生成更高质量的主题表示。
lda2vec Moody的pytorch实现是一种使用词嵌入的主题建模方法。原始论文为:(此处省略了链接)。需要特别注意的是,我认为使lda2vec算法起作用非常困难。有时它能发现几个主题,但有时候却找不到任何有意义的主题。通常情况下,找到的话题质量较差。该算法容易陷入次优的局部最小值,并且很大程度上依赖于初始主题分配的选择。关于我的实验结果,请参见20newsgroups/explore_trained_model.ipynb中的内容。
在训练失败的情况下,操作如下:首先将文档语料库转换为一组元组{(document id, word, the window around the word) | for each word in the corpus} {(document id, word, the window around the word)}。
全部评论 (0)
还没有任何评论哟~


