
过拟合与欠拟合及解决方法
5星
- 浏览量: 0
- 大小:None
- 文件类型:PDF
简介:
本文章介绍机器学习中的两个常见问题——过拟合和欠拟合,并提出相应的解决方案。
过拟合与欠拟合及其解决方案
模型在训练数据集上表现良好,并不意味着它在测试数据集上的性能也会同样出色。
训练误差指的是模型在训练数据集中的错误率,而泛化误差则是指该模型对新的、未见过的数据的预测能力。通常通过测试数据集中样本的表现来估算这个值。
一般来说,在用特定训练数据学习到的参数下,模型可能会在其原始训练集上表现得比实际新输入的数据要好。因为无法直接从训练误差中推断出泛化误差,所以仅仅减少训练误差并不一定能够导致泛化误差的降低。
在机器学习的应用场景里,通常需要评估多个候选模型的表现来决定最终选择哪个模型进行使用。这个过程被称作“模型选择”。这些备选方案可能包括具有不同超参数设置的不同类型的相同类别的模型。例如,在多层感知器中,可以通过调整隐藏层数量和节点数量等来进行不同的配置以找到最佳的性能表现。
以上就是关于过拟合与欠拟合并如何通过优化训练过程来改进机器学习模型的基本介绍。
全部评论 (0)
还没有任何评论哟~


