
基于Python的朴素贝叶斯垃圾分类算法实现
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本项目采用Python语言实现了朴素贝叶斯分类器在垃圾邮件识别中的应用,并将其扩展至通用文件类型的智能分类场景。
一、模型方法
本工程采用的模型方法是朴素贝叶斯分类算法,其核心思想基于概率论。我们称之为“朴素”,是因为在整个形式化过程中只做出最原始、最基本的假设。作为贝叶斯决策理论的一部分,理解朴素贝叶斯之前需要先快速了解下贝叶斯决策理论的基本概念。
假设有这样一个数据集,它包含两类不同的数据点,并且这两类的数据分布如图所示(此处省略具体图形描述)。
现在我们用p1(x,y)表示一个特定坐标位置(x, y)属于类别1的概率,而用p2(x,y)表示该坐标下属于类别2的概率。对于一个新的输入数据点(x, y),我们可以根据以下规则判断其所属的分类:如果 p1(x,y) > p2(x,y),则认为它更可能归属于第一类;反之,则倾向于归属第二类。
全部评论 (0)
还没有任何评论哟~


