
Python数据清洗与预处理
5星
- 浏览量: 0
- 大小:None
- 文件类型:ZIP
简介:
《Python数据清洗与预处理》是一本指导读者使用Python语言进行高效数据处理的技术书籍,涵盖数据加载、清理及转换等关键步骤。
在实际工作中获取的数据通常不尽如人意,可能会包含非数值类型的文本数据、重复值、缺失值、异常值及分布不均衡等问题。为解决这些问题,需要进行特征工程相关工作,这一般包括特征使用方案、特征获取方案、特征处理和特征监控等环节。其中最为关键的是特征处理部分,有时也被称作数据预处理。
* 1. 处理非数值类型的数据
* 2. 清除重复值、填补缺失值及排除异常值
* 3. 数据标准化
* 4. 数据离散化
* 5. 调整数据类型和精度转换
* 6. 进行数据抽样
*7. 对数据进行排序
全部评论 (0)
还没有任何评论哟~


