
RUSBoost 是一种基于 boosting 技术的采样方法,旨在解决类标记数据中存在的类别不平衡问题。- MATLAB 开发。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
此代码实现了 RUSBoost 算法,该算法专门用于解决在包含离散类标签的数据集中遇到的类不平衡问题。RUSBoost 巧妙地融合了随机欠采样 (RUS) 技术和标准的提升程序 AdaBoost,通过系统性地移除多数类样本,从而更有效地对少数类进行建模。值得注意的是,这种方法与 SMOTEBoost 具有相似之处,后者同样结合了 boosting 和数据采样策略,但宣称其目标是通过随机欠采样 (RUS) 来达成目标多数类的平衡。 采用 RUSBoost 方法能够显著简化算法结构,并加速模型训练过程。目前,作者独立完成了该算法的实现,主要出于研究目的。为了方便用户利用多种不同的弱学习器进行提升操作,开发了一个基于 Weka API 的接口。当前版本支持四种 Weka 算法作为弱学习器:J48、SMO、IBk 和 Logistic。 该算法执行十次 boosting 迭代,并在每次迭代中通过删除多数类样本来维持约 35:65 的类不平衡比例(少数类样本:多数类样本)。
全部评论 (0)
还没有任何评论哟~


