
SMOTE的Matlab代码-Smogn:适用于回归的合成少数类过采样技术
5星
- 浏览量: 0
- 大小:None
- 文件类型:ZIP
简介:
本文提供了一种用于处理回归问题中的样本不均衡现象的方法——Smogn,它是基于SMOTE算法改进的MATLAB实现代码。通过引入新颖的数据筛选机制和参数优化策略,有效提升了模型在少数类样本上的预测性能。
合成少数过采样技术(SMOTE)的MATLAB代码用于高斯噪声回归。
描述:
这是针对高斯噪声回归实现的合成少数过采样技术(SMOGN)的Python版本。
使用传统插值以及引入高斯噪声 (SMOTER-GN),进行回归的合成少数过采样技术(SMOTER)。根据给定观察结果与最近邻(KNN)的距离,在这两种方法之间做出选择:如果距离足够近,则应用SMOTER;若距离较远,使用SMOTER-GN。
适用于预测值很少或不常见的回归问题,并且可以作为对倾斜响应变量进行日志转换的替代方案,特别是在需要生成合成数据的情况下。
特点:
- 唯一开源Python版本的合成少数过采样技术实现
- 支持混合类型的数据集(Pandas DataFrame输入)
- 自动选择距离度量并可选地删除缺失值
- 灵活的参数设置,在连续响应变量和友好参数内控制感兴趣的区域,以对合成数据进行过采样。
- 完全Pythonic开发,旨在保证一致性、易于维护,并为未来改进提供基础。没有使用原始R实现中的外部C或Fortran函数调用。
要求:
Python 3
NumPy
Pandas
全部评论 (0)
还没有任何评论哟~


