计算机视觉2-设计分类器(2)

1.多层感知器(全连接神经网络)

 

 

 

w1行数自己设定,列数由x维度决定

 

 

 

全连接神经网络可解决线性不可分问题,如图:

隐层的个数为指定的模板的个数,输出层的个数为类别数

 

 

 

2.激活函数(对每一层中输出向量的每个维度进行处理)

 

 

即此函数中的max,如果去掉激活函数,全连接神经网络将变为线性分类器。

 

 

 

 3.损失函数

 

(1)softmax:将输出结果处理为输出概率 

 

                    

 

 

 (2)交叉熵损失:度量分类器输出与预测值之间的距离

                 

 

 

 

 

当真实分布为one-hot形式时,交叉熵损失为KL散度

 

 

4.交叉熵损失对比多类支撑向量机损失

  

除了计算方法不同,交叉熵损失在分数结果分布较为相近时比较大,如10,9,9。要求在求出结果的同时降低其他分布的概率。

                                 多类支撑向量机损失则在求出 分数-标答>1,向量机损失直接为0,结束。

 

 

5.计算图:反着计算的时候将梯度理解为导数  上一轮的结果(即梯度导数)乘这一轮的局部梯度导数(将结果带入x)。 

上为得数,下为梯度

可由反向传播求出f对w的梯度

 

选择激活函数时尽量选择ReLu或leaklyReLu,可防止梯度消失

 

posted @ 2021-10-31 20:57  人都傻了  阅读(99)  评论(0)    收藏  举报