
异常值的处理
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
简介:本章节探讨数据集中异常值的识别与处理方法,包括统计学方法、箱线图法及基于机器学习的方法,并讨论了不同处理策略对数据分析结果的影响。
机器学习异常值处理
数据预处理之异常值处理
一、什么样的值是异常值?
简单来说,在数据集中存在一些不合理的数值,这些被称为离群点或异常值。例如,在进行客户分析时发现客户的年平均收入为80万美元,但有两位客户的年收入分别为4美元和420万美元。这两个极端的收入水平明显与其他人的不同,因此被视为异常值。
二、什么会引起异常值?
每当遇到异常值时,处理这些数据的理想方法是找出导致它们出现的原因。不同的原因会导致采取不同的处理方式,通常可以将引起异常值的因素分为两大类:
全部评论 (0)
还没有任何评论哟~


