
SMOTE的Matlab代码与KDD-CUP-99-Python: 使用Python和Scikit-Learn处理KDDCUP99数据...
5星
- 浏览量: 0
- 大小:None
- 文件类型:ZIP
简介:
本项目使用Python及Scikit-Learn库处理KDDCUP99数据集,结合MATLAB实现的SMOTE算法提升不平衡分类问题性能,促进网络安全研究。
使用Python、scikit-learn和matplotlib对原始KDD Cup 99网络入侵检测数据集的10%子集进行分析和预处理。
线性可分性测试:采用凸包(Convex-Hull)方法来评估各种攻击类型的线性可分性。正常类与两种最常见的攻击类型——海王星( Neptune ) 和蓝精灵 (Teardrop) 的边界在二维图中可视化,以展示它们的非线性关系。
使用SMOTE和Cluster-Centroids重采样:为了减轻预处理阶段描述的数据不平衡问题,应用了常见的重采样技术。欠采样通过聚类中心(Cluster Centroids)方法实现,该方法将数据基于相似性分组,并且目标是尽可能避免信息丢失。过采样则采用合成少数类过样本技术(SMOTE),通过对少数类别中的点附加其k最近邻来生成新的样本。
此项目许可归Timea Magyar所有。允许以源代码和二进制形式重新发布和使用,只要满足相关条件即可。
全部评论 (0)
还没有任何评论哟~


