
数据挖掘学习之旅第四站:Python中的去极值方法
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本篇文章是数据挖掘系列教程的一部分,专注于讲解在Python中如何应用去极值方法来优化数据分析过程。通过实例分析帮助读者掌握这一关键技术点。
MAD(Mean Absolute Deviation),即绝对值差中位数法,是一种用于检测离群值的方法。其处理步骤如下:
第一步:找出所有因子的中位数值Xmedian。
第二步:计算每个因子与中位数之间的绝对偏差Xi?Xmedian。
第三步:求出这些绝对偏差值的中位数MAD。
第四步:设定参数n,以确定合理的范围为[Xmedian-n*MAD, Xmedian+n*MAD]。对于超出此合理范围的数值进行如下调整:
- 如果某个因子值超过最大限制,则用该范围内的最大值代替。
- 若某因子值低于最小限制,则使用该范围内的最小值替换。
定义函数filter_extreme_MAD(series,n)用于执行上述操作。
全部评论 (0)
还没有任何评论哟~


