
深度学习(三)——过拟合与欠拟合及解决策略;梯度消失和梯度爆炸;循环神经网络的深入探讨
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本文详细讨论了深度学习中常见的问题如过拟合、欠拟合以及相应的解决方案,同时分析了梯度消失和梯度爆炸现象,并对循环神经网络进行了深入剖析。
在解释上述现象之前,我们需要区分训练误差(training error)和泛化误差(generalization error)。通俗来讲,前者指模型在训练数据集上表现出的误差,后者指模型在任意一个测试数据样本上的预期误差,并常常通过测试数据集上的误差来近似。计算这两种误差可以使用之前的损失函数,例如线性回归中使用的平方损失函数。
全部评论 (0)
还没有任何评论哟~


