在深度学习中,当模型在训练过程中出现权重更新幅度过大,导致训练不稳定的情况时,通常与以下哪个问题有关?
答案解析
核心考点说明:本题考查深度学习中梯度爆炸的概念。
解题思路分析:题目描述了权重更新幅度过大导致训练不稳定的情况,这直接对应梯度爆炸的定义。
选项分析:
- A. 梯度消失:指在反向传播过程中,梯度逐渐减小到接近于零,导致网络底层参数无法更新,与权重更新幅度过大相反。
- B. 梯度爆炸:指在反向传播过程中,梯度变得非常大,导致权重更新幅度过大,符合题目描述的情况。
- C. 欠拟合:指模型无法很好地拟合训练数据,训练和测试误差都会比较高,与权重更新幅度过大无关。
- D. 学习率过小:会导致权重更新幅度过小,训练速度慢,不会导致更新幅度过大。
易错点提醒:注意区分梯度消失和梯度爆炸,以及它们对训练过程的影响。
正确答案:B