浅谈神经网络中的bias

1、什么是bias？

偏置单元（bias unit），在有些资料里也称为偏置项（bias term）或者截距项（intercept term），它其实就是函数的截距，与线性方程 y=wx+b 中的 b 的意义是一致的。在 y=wx+b中，b表示函数在y轴上的截距，控制着函数偏离原点的距离，其实在神经网络中的偏置单元也是类似的作用。
因此，神经网络的参数也可以表示为：(W, b)，其中W表示参数矩阵，b表示偏置项或截距项。

2、bias的计算方式？

　神经网络结构中对偏置单元的计算处理方式有两种，
　（1）设置偏置单元=1，并在参数矩阵 Θ 中设置第 0 列对应偏置单元的参数，对应的神经网络如下：
　
　其中，x₀ 是第一层的偏置单元（设置为1），Θ⁽¹⁾₁₀ 是对应该偏置单元 x₀ 的参数；a⁽²⁾₀ 是第二层的偏置单元，Θ⁽²⁾₁₀是对应的参数。
　在计算激活值时按照（以a⁽²⁾₁为例）：
　

相当于bias本身值为1，但它连接各个神经元的权重不为1，即---整个神经网络只有1个bias，对应有多个不同的权重（权重个数等于hide层和out层神经元的个数）

　（2）设置偏置单元，不在参数矩阵中设置对应偏置单元的参数，对应的神经网络如下：
　
　其中，b⁽¹⁾ 是 W⁽¹⁾ 对应的偏置单元向量，b⁽²⁾ 是 W⁽²⁾ 对应的偏置单元向量，b⁽¹⁾₁ 是对应 a⁽²⁾₁ 的偏置单元。注意，此时神经网络的参数表示更改为：(W, b)
　在计算激活值时按照：
　

相当于bias连接各个神经元的所有权重都为1，但bias本身不为1，即---有多个bias，但所有的bias对应的权重都为1（bias的个数等于hide层和out层神经元的个数）

　综上，
　两者的原理是一致的，只是具体的实现方式不同。
　其实在大部分资料和论文中看到的神经网络的参数都是表示为：(W, b)，其中W代表weight，b代表bias。包括在UFLDL Tutorial中也是采用 (W, b) 表示，只是在Coursera上Andrew Ng老师的在线教程中看到将神经网络参数表示为 Θ，个人还是更喜欢 (W, b) 这种表示，很清晰。

参考资料

http://blog.csdn.net/walilk/article/details/50278697

posted @ 2017-05-09 20:37 帅帅的飞猪阅读(25519) 评论(1) 收藏举报

刷新页面返回顶部

帅帅的飞猪

All things are difficult before they are easy

浅谈神经网络中的bias

公告