
contextualized-topic-models:一个用于执行上下文化主题建模的Python工具包。CTM结合了BERT和主题模型...
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
Contextualized-Topic-Models(CTM)是一个先进的Python工具包,它融合了BERT与传统主题模型的优势,专为实现高效的上下文化主题建模设计,适用于深入分析文本数据中的语义信息。
情境化主题模型(CTM)是一系列利用语言预训练表示形式(如BERT)进行主题建模的主题模型。这些模型在文档嵌入方面表现出色,并且支持多种不同的语言,具体取决于HuggingFace所支持的范围。这一系列包括两个版本:CombinedTM将上下文嵌入与旧单词结合使用以提高主题连贯性;ZeroShotTM则适用于缺少训练数据中词汇的情况,如果经过多语言模型训练,则可以实现跨语言的主题建模功能。相关研究详见论文《具有零镜头学习功能的跨语言情境主题模型》和《预培训是一个热门话题:上下文化文档嵌入可提高主题一致性》。
全部评论 (0)
还没有任何评论哟~


