深度学习中的优化算法Optimizer比较和总结

陈华 • 2022年03月29日 • 人工智能 • 阅读 914

深度学习中的优化问题通常指的是：寻找神经网络上的一组参数θ，它能显著地降低代价函数J(θ)。主要优化算法有：BGD、SGD、Momentum、Adagrad、Adadelta、RMSProp、Adam。

深度学习中的优化问题通常指的是：寻找神经网络上的一组参数θ，它能显著地降低代价函数J(θ)。针对此类问题，研究人员提出了多种优化算法，Sebastian Ruder 在《An overview of gradient descent optimizationalgorithms》（链接：https://arxiv.org/pdf/1609.04747.pdf ）这篇论文中列出了常用优化算法的比较。主要优化算法有：BGD、SGD、Momentum、Adagrad、Adadelta、RMSProp、Adam。

优化算法简单介绍

BGD：批量梯度下降，每次迭代采用整个训练集数据来计算损失函数J(θ)对参数θ的的梯度。

SGD：随机梯度下降法，用单个训练样本的损失来近似平均损失。

Momentum：动量算法。

Adagrad：是一种可以自动改变学习速率的优化算法，只需设定一个全局学习速率ϵ。

Adadelta：adagrad算法的延伸和改进，

RMSProp：自适应学习率方法，引入一个衰减系数ρ，让r每次都以一定的比例衰减，类似于Momentum中的做法。

Adam（Adaptive Moment Estimation）：Momentum+RMSProp，带有动量项的RMSProp算法。

参考文档

https://zhuanlan.zhihu.com/p/55150256

https://zhuanlan.zhihu.com/p/43506482

https://www.cnblogs.com/54hys/p/12340332.html

https://www.cnblogs.com/zingp/p/11352012.html

本文为陈华原创，欢迎转载，但请注明出处：http://www.ichenhua.cn/read/240

上一篇：: 深度学习中的Batch Norm、LN、IN、GN规范化

下一篇：: 深度学习中的损失函数(Loss Function)比较和总结

陈华编程

NLP算法工程师 / 量化交易、人工智能培训讲师。

人工智能基金理财日记副业外快

公众号：chenhua_edu

关于我们

合作平台

相关网站

联系我们

工作时间 : 周一至周五 9:00-18:30
官方微信/QQ : 342711044
陌访请说明来意！

Copyright © 2011-2024 Powered by 陈华 http://www.ichenhua.cn | Archiver 京ICP备18031395号-1