在深度神经网络训练过程中,如果模型的训练误差很低,但测试误差很高,最有可能发生以下哪种情况?
答案解析
核心考点说明:本题考查深度学习中过拟合的概念。过拟合是指模型在训练数据上表现良好,但在未见过的数据(测试数据)上表现较差的现象。
解题思路分析:题目描述了训练误差低但测试误差高的典型情况,这直接对应过拟合的定义。
选项分析:
- A. 梯度消失:指在反向传播过程中,梯度逐渐减小到接近于零,导致网络底层参数无法更新,通常表现为训练停滞,不符合题目描述。
- B. 梯度爆炸:指在反向传播过程中,梯度变得非常大,导致权重更新幅度过大,通常表现为模型不稳定,不符合题目描述。
- C. 过拟合:指模型过度学习训练数据的细节,导致在测试数据上泛化能力差,完全符合题目描述。
- D. 欠拟合:指模型无法很好地拟合训练数据,训练和测试误差都会比较高,不符合题目描述。
易错点提醒:注意区分过拟合和欠拟合的概念,以及梯度消失/爆炸通常带来的训练问题,不要混淆。
正确答案:C