什么是批标准化 (Batch Normalization)

Batch Normalization, 批标准化, 和普通的数据标准化类似, 是将分散的数据统一的一种做法。

训练更深层的神经网络一直是深度学习中提高模型性能的重要手段之一。

批规范化操作,不仅加快了模型收敛速度,而且更重要的是在一定程度缓解了深层网络的一个难题“梯度弥散”,从而使得训练深层网络模型更加容易和稳定。另外,批规范化操作不光适用于深层网络,对传统的较浅层网络而言,批规范化也能对网络泛化性能起到一定提升作用。目前批规范化已经成为了几乎所有卷积神经网络的标配。

首先,我们来看一下批规范化操作(简称 BN)的流程。顾名思义,“批规范化”,即在模型每次随机梯度下降训练时,通过mini-batch来对相应的网络响应做规范化操作,使得结果(输出信号各个维度)的均值为0,方差为1。

BN 算法

什么是批标准化 (Batch Normalization)

我们引入一些 batch normalization 的公式. 这三步就是我们在刚刚一直说的 normalization 工序, 但是公式的后面还有一个反向操作, 将 normalize 后的数据再扩展和平移. 原来这是为了让神经网络自己去学着使用和修改这个扩展参数 gamma, 和 平移参数 β, 这样神经网络就能自己慢慢琢磨出前面的 normalization 操作到底有没有起到优化的作用, 如果没有起到作用, 我就使用 gamma 和 belt 来抵消一些 normalization 的操作.

什么是批标准化 (Batch Normalization)

最后我们来看看一张神经网络训练到最后, 代表了每层输出值的结果的分布图. 这样我们就能一眼看出 Batch normalization 的功效啦. 让每一层的值在有效的范围内传递下去。

BN 来规范化某些层或所有层的输入,从而可以固定每层输入信号的均值与方差。这样一来,即使网络模型较深层的响应或梯度很小,也可通过BN的规范化作用将其的尺度变大,以此便可解决深层网络训练很可能带来的“梯度弥散”问题。

在实验中, 研究人员发现可通过BN来规范化某些层或所有层的输入,从而可以固定每层输入信号的均值与方

差。这样一来,即使网络模型较深层的响应或梯度很小,也可通过BN的规范化作用将其的尺度变大,以此便可解决深层网络训练很可能带来的“梯度弥散”问题。

一个直观的例子:对一组很小的随机数做ℓ2 规范化操作:

什么是批标准化 (Batch Normalization)

关于BN 的使用位置,在卷积神经网络中BN 一般应作用在非线性映射函数前。另外,若神经网络训练时遇到收敛速度较慢,或“梯度爆炸”等无法训练的状况发生时也可以尝试用BN来解决。同时,常规使用情况下同样可加入BN 来加快模型的训练速度,甚至提高模型精度。

相关概念

归一化:

1)把数据变成(0,1)或者(1,1)之间的小数。主要是为了数据处理方便提出来的,把数据映射到0~1范围之内处理,更加便捷快速。

2)把有量纲表达式变成无量纲表达式,便于不同单位或量级的指标能够进行比较和加权。归一化是一种简化计算的方式,即将有量纲的表达式,经过变换,化为无量纲的表达式,成为纯量。

标准化:

在机器学习中,我们可能要处理不同种类的资料,例如,音讯和图片上的像素值,这些资料可能是高维度的,资料标准化后会使每个特征中的数值平均变为0(将每个特征的值都减掉原始资料中该特征的平均)、标准差变为1,这个方法被广泛的使用在许多机器学习算法中(例如:支持向量机、逻辑回归和类神经网络)。

中心化:平均值为0,对标准差无要求

归一化和标准化的区别:

归一化是将样本的特征值转换到同一量纲下把数据映射到[0,1]或者[-1, 1]区间内,仅由变量的极值决定,因区间放缩法是归一化的一种。标准化是依照特征矩阵的列处理数据,其通过求z-score的方法,转换为标准正态分布,和整体样本分布相关,每个样本点都能对标准化产生影响。它们的相同点在于都能取消由于量纲不同引起的误差;都是一种线性变换,都是对向量X按照比例压缩再进行平移。

标准化和中心化的区别:

标准化是原始分数减去平均数然后除以标准差,中心化是原始分数减去平均数。 所以一般流程为先中心化再标准化。

无量纲:我的理解就是通过某种方法能去掉实际过程中的单位,从而简化计算。

125jz网原创文章。发布者:江山如画,转载请注明出处:http://www.125jz.com/11121.html

(0)
江山如画的头像江山如画管理团队
上一篇 2022年9月22日 上午9:44
下一篇 2022年9月22日 下午2:17

99%的人还看了以下文章

  • 如何关闭微信朋友圈?

    在搜索引擎上输入“关闭朋友圈”,你可以看到很多心得体会。UC上也有一篇文章介绍的是作者从三年前天天刷朋友圈,到三年后 最终关闭了微信朋友圈。 作者最后一句总结:关闭朋友圈的20天后,我已经习惯了没有朋友圈的日子,而且,我永远不会再开启它。 中国青年报社会调查中心对2000名受访者进行了相关调查,调查显示,有高达35.8%的受访者想要关闭朋友圈,其中19.7%…

    2020年2月25日
    3.5K0
  • 5大手机导航软件对比,哪个好?

    手机导航软件哪个好,手机地图导航是人们外出旅行必不可少的软件。 手机导航分为离线导航和在线导航;离线导航不需要网络,但是地图数据占据很大空间,数据更新较慢;在线导航需要网络,地图数据更新比较快;现在大多手机导航和手机地图已支持离线导航和在线导航两种模式,可以提前把地图数据包下好哦! 现在手机地图软件那么多,到底哪一款用起来更好呢,下面小编为大家推荐几款优秀的…

    2020年2月25日
    7.5K0
  • 嵌入式人工智能与物联网应用技术学习资料及课程内容大全

    人工智能是近两年的热门话题,深度学习、智能驾驶、智能家居、机器人等AI相关领域成为创业创新的焦点。嵌入式人工智能技术在智能终端上的应用发展十分迅猛,在工厂智能化、无人机、智能手机、机器人、智能汽车等方向,从用户、医院、汽车、飞机和工厂等都出现了嵌入式人工智能的身影。 嵌入式人工智能(嵌入式AI),是一种让AI算法可以在终端设备上运行的技术概念。换句话说,它的…

    2020年7月20日
    5.0K0
  • 人类未来,互联网即将消失,一个有趣的世界即将诞生。

    互联网即将消失,一个高度个性化、互动化的有趣世界——物联网即将诞生。 ——互联网巨头谷歌公司的执行董事长埃里克·施密特 施密特的此番言论可谓自我颠覆。他说:“我可以非常直接地说,互联网将消失。” 一、互联网即将消失,物联网将无所不能 施密特称,未来将有数量巨大的IP地址、传感器、可穿戴设备,以及虽感觉不到却可与之互动的东西,时时刻刻伴随你。 “设想下你走入房…

    2018年12月31日
    4.4K0
  • 原码,补码,反码转换例题精讲

    原码,反码,补码,都为二进制数 0为正,1为负 原码=符号位+原值 反码=原码的符号位不变+原值全部取反 补码=反码+1 例题1:已知原码求反码与补码 例如 令x的原码为10110100,求其补码与反码? 原码:10110100 反码:11001011 补码:11001100 补码=符号位不变+原数值 反码=补码-1 原码=反码的符号位不变+原数值全部取反 …

    科技 2020年4月26日
    6.7K1
  • 这些习惯也许会毁掉你的电脑

    1、大力敲击回车键 这个恐怕是人所共有的通病了,因为回车键通常是我们完成一件事情时,最后要敲击的一个键,大概是出于一种胜利的兴奋感,每个人在输入这个回车键时总是那么大力而爽快地敲击。本人的多个键盘就是这样报废的,最先不看见字的是AWSD(呵呵,心知肚明),最先不能使用的按键却是Enter。 解决办法:解决方法有两个,第一是控制好你的情绪,第二是准备好你的钱包…

    2020年3月22日
    3.0K0

发表回复

登录后才能评论