杏彩产品PRDUCTS DISPLAY

联系我们

联系人:张生

咨询热线:400-123-4657

传真:+86-123-4567

手机:13800000000

邮箱:admin@youweb.com

地址:广东省广州市天河区88号

在线咨询

行业资讯

您现在的位置是: 首页 > 杏彩动态 > 行业资讯

Adam优化器的Initialization Bias Correction

Adam

如上图所示,算法中涉及两个滑动平均m_tv_tm_t是梯度的滑动平均,v_t是梯度的平方的的滑动平均。问题出在这两个变量的初始化,它们都被初始化为0,那么在迭代之初和decay非常弱的时候(\beta \sim 1),会出现 0/0,导致溢出。

因此,Adam使用了一个简单的初始化校正。为了纠正滑动平均v_t和我们真正想要的E[g_t^2]之间的差距,我们来算一下E[v_t]

$v_t$

discrepancy

如果E(g_i^2)是平稳的,即每个时刻的均值一样,那么我们有\zeta=0。那么唯一的差别就仅有1 - \beta_2^t。所以除掉它就好啦!

在线客服

关注我们 在线咨询 投诉建议 返回顶部

平台注册入口