
基于TF-IDF、TensorFlow、词云及LDA的新闻自动摘要推荐系统——深度学习算法的应用(附带ipynb源码和训练数据集)
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本项目构建了一个结合TF-IDF、TensorFlow与LDA技术的新闻自动摘要推荐系统,利用词云可视化关键信息。提供源代码及训练数据集以供参考。
本项目利用了TF-IDF关键词提取技术,并结合词云数据可视化、LDA(Latent Dirichlet Allocation)模型训练及语音转换系统,来开发一个基于TensorFlow的文本摘要程序。
项目的运行环境包括Python环境和Tensorflow环境。整个项目包含六个模块:数据预处理、词云构建、关键词提取、语音播报、LDA主题模型以及模型构建。该项目使用了清华大学NLP实验室推出的中文文本数据集THUCNews,并借助jieba库进行中文分词工作。通过运用TF-IDF算法,成功实现了关键词的提取;这些关键字随后会利用pyttsx3转换成语音进行播放。同时,项目还采用了文档主题生成模型LDA来进行文档的主题建模。
项目的准确率达到了97.04%。
全部评论 (0)
还没有任何评论哟~


