
本研究论文探讨了基于数据填充和连续属性的朴素贝叶斯算法。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
朴素贝叶斯算法(NB)在解决分类任务时,通常会预设训练样本的数值型连续属性遵循正态分布规律。然而,该算法的分类准确率同样会受到训练数据完整程度的制约,并且真实采集到的数据往往难以完全符合这一前提条件。为了应对数据缺失这一挑战,本文提出了一种基于期望最大值算法(EM)的方法,该方法利用现有不完整的数据集进行参数的学习过程。此外,考虑到实际样本中的数值型连续属性可能不符合正态分布的情况,我们采用核密度估计技术,通过分析计算其分布密度(Distribution Density),进而推导出最大后验分布。为了进一步验证所改进算法的有效性,我们同时利用标准数据集进行了分类实验。将此改良后的算法EM-DNB应用于生物工程蛋白质纯化工艺预测中,实验结果证实了其预测精度的显著提升。
全部评论 (0)
还没有任何评论哟~


