
利用Python开发的垃圾短信识别系统(结合KNN、逻辑回归、随机森林、决策树及多项式与伯努利分布朴素贝叶斯等多种算法)
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本项目基于Python构建,运用KNN、逻辑回归、随机森林、决策树以及多项式和伯努利分布的朴素贝叶斯算法,旨在高效识别垃圾短信。
本项目是一个基于Python的垃圾短信识别程序,采用KNN、逻辑回归、随机森林、决策树及朴素贝叶斯等多种算法进行融合以提高判别准确率,并进行了相应的测试与应用。
项目的运行环境包括Python环境以及jieba分词库和Scikit-learn库等。整个项目由前端模块和后端模块组成,其中前端模块包含短信输入页面和输出结果的展示页面;而后端则涵盖了数据预处理、模型训练及nginx配置等功能。
在准确率评估方面,对比结果显示KNN算法具有100%的正确率,但其召回率为4.59%,即仅能标记出测试集中约4.59%的真实垃圾短信。此外,在速度上,KNN、逻辑回归和朴素贝叶斯模型运行较快;而随机森林及决策树则相对较慢;梯度提升迭代决策树由于需要不断对残差进行迭代处理,因此其执行效率最低。综合考虑召回率与准确率两方面因素后发现,两种不同的朴素贝叶斯算法表现较为理想。
全部评论 (0)
还没有任何评论哟~


