
corex_topic:基于CorEx的稀疏计数数据层次化无监督及半监督主题建模
5星
- 浏览量: 0
- 大小:None
- 文件类型:ZIP
简介:
本研究提出了一种新颖的方法,利用CorEx算法对稀疏计数数据进行层次化的无监督和半监督主题建模,以揭示数据深层结构与模式。
CorEx主题模型是一种生成丰富且具有高度信息量的主题的方法。与其他主题建模方法相比,CorEx的独特优势在于它能够根据用户需求灵活地作为无监督、半监督或分层的模型运行。在半监督模式下,通过引入“锚词”,CorEx允许用户将领域知识融入到模型中,并指导其发展方向。这使得采用创新策略来改进主题表示和分离成为可能。
总的来说,这种实现方式非常适合用于对任何稀疏二进制数据进行聚类操作。如果使用该代码,请参考以下文献:
Gallagher RJ, Reing K., Kale D. and Ver Steeg G. CorEx: Hierarchical topic modeling with minimal domain knowledge. Transactions of the Association for Computational Linguistics (TACL), 2017年。
入门指南
安装
可以通过pip命令来安装用于Python的CorEx主题模型代码:
```
pip install corex
```
全部评论 (0)
还没有任何评论哟~


