
【机器学习(6)】数据预处理:包括预处理、标准化与数据纠偏
5星
- 浏览量: 0
- 大小:None
- 文件类型:PDF
简介:
本教程为机器学习系列课程第六部分,专注于数据预处理技术,涵盖数据清理、标准化及数据纠偏等内容,助力提升模型准确性。
模型评价体系
回顾一下以前提及的模型评价的相关概念:
- **模型(model)**:表示规律和经验。
- **学习(learning)**:指从数据中总结出规律的过程。
- **误差(error)**:用于衡量模型准确性的指标。
- **训练集(教材教辅)**:用以训练模型的数据集合。
- **验证集(模拟考卷)**:用来测试和评估模型泛化能力的数据集合。
- **应用数据(高考)**:在实际应用场景中,代表真实特征的数据库。
关于数据预处理与特征工程:
概念上讲,它涵盖了对原始训练数据进行变换、添加或删除特定属性的方法。其目标在于通过这些操作提升模型的学习表现和泛化能力。具体来说:
- **特征变换**包括但不限于预处理、标准化以及纠偏等步骤。
- **特征增加与删减**则是指根据需要选择性的加入新的变量或者移除不重要的特性。
以上就是关于数据预处理及特征工程的基本概念介绍。
全部评论 (0)
还没有任何评论哟~


