AdaGrad算法—随机梯度下降算法

江山如画 • 2023年10月9日下午2:47 • 编程开发 • 阅读 572

AdaGrad算法，它可以根据自变量在每个维度的梯度值的大小来调整各个维度上的学习率，从而避免统一的学习率难以适应所有维度的问题。

AdaGrad算法特点：

如果目标函数有关自变量中某个元素的偏导数一直都较大，那么该元素的学习率将下降较快；反之，如果目标函数有关自变量中某个元素的偏导数一直都较小，那么该元素的学习率将下降较慢。

自变量中每个元素的学习率在迭代过程中一直在降低（或不变）。

所以，当学习率在迭代早期降得较快且当前解依然不佳时，AdaGrad算法在迭代后期由于学习率过小，可能较难找到一个有用的解。

Pytorch简洁实现AdaGrad算法–使用optim.Adagrad

通过名称为Adagrad的优化器方法，我们便可使用PyTorch提供的AdaGrad算法来训练模型。

d2l.train_pytorch_ch7(torch.optim.Adagrad, {‘lr’: 0.1}, features, labels)

输出：

loss: 0.243147, 0.040675 sec per epoch

总结

AdaGrad算法在迭代过程中不断调整学习率，并让目标函数自变量中每个元素都分别拥有自己的学习率。
使用AdaGrad算法时，自变量中每个元素的学习率在迭代过程中一直在降低（或不变）。

125jz网原创文章。发布者：江山如画，转载请注明出处：http://www.125jz.com/12302.html

赞 (0)

江山如画管理团队

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

键山秀三郎的《扫除道》-通过打扫卫生来提高生活品质和人际关系

上一篇 2023年10月8日下午9:48

下一篇 2023年10月21日上午6:44

编程开发

Undefined variable: file python3不再支持file函数

python处理文件时，使用file函数，提示错误：Undefined variable: file 反复查看语法，没有问题啊，最后查找到原因： python3不再支持file函数替代方法：可以用open代替file 函数。

江山如画
2019年3月29日
7.5K01
编程开发

python 字典使用实例：创建通信录并完成修改、查找操作

练习目的：巩固python 字典的创建，合并，修改及使用。学了python字典后,同学们想创建一个自己的通信录,小明是这么做的：先根据三位舍友的联系方式创建一个字典dicTXL 然后将隔壁舍长已创建好的字典dicOther合并进自己的通信录合并之后，小明又打算给通信录增加一列“微信号”，为此他询问了相关同学的微信号并存储在了字典dicWX中，然后合并进…

江山如画
2020年1月22日
12.5K048
编程开发

第二章 Web技术简介

1. 掌握HTML 5标记语言
2. 掌握CSS样式表的使用
3. 掌握JavaScript脚本语言
4. 能够使用HTML5+CSS+JS 进行web页面设计

江山如画
2018年2月2日
2.7K00
编程开发

object…object和object[]…object的区别

object…object public int update(String sql, Object… params) throws SQLException { Connection conn = this.prepareConnection(); return this.update(conn, true, sql, params); }…

江山如画
2019年11月19日
1.9K00
编程开发

python 函数，字典，列表使用综合实例（经典）

现有一字典： dict1 = {’01’: [67, 88, 45], ’02’: [97, 68, 85], ’03’: [97, 98, 95], ’04’: [67, 68, 45], } 存放着学生的学号和成绩。成绩列表中的3个数据分别是学生的语文、数学、英语成绩。要求： 1.编写函数，返回每门成绩均大于等于85的学生的学号。 dict1 = {‘…

江山如画
2020年1月31日
4.0K07
编程开发

dao service view pojo utils tools都放什么？ jsp的（MVC）三层架构入门

java的（MVC）三层架构（dao、service、view） Java EE典型架构，分层的目的：高内聚，低耦合。一般java都是三层架构（还可加一个：工具类：util比如处理多语言功能，网站非法信息过滤等等功能的代码集）；三层架构体系，是逻辑上的三层，按照完成功能不同，所做事宜不同，将项目分为三个层次 1：数据访问层（dao） 2：业务逻辑层…

江山如画
2020年10月24日
4.1K00

发表回复

登录后才能评论