哪种优化算法适合处理稀疏梯度问题?

答案解析

本题考察优化算法的适用场景。AdaGrad为每个参数分配不同的学习率,特别适合处理稀疏梯度问题,因此是正确答案。Adam、动量法和RMSProp虽然各有优点,但并不专门针对稀疏梯度问题。
正确答案:B
随机推荐
开始刷题