摘要:        
https://www.bilibili.com/video/BV184411Q7Ng?p=76 注解: 让交叉熵损失值最小等价于目标值处1对应的概率值最大,直觉上看相当于是强制拟合一个非线性函数,或者说强符合一个非线性函数。 让交叉熵损失值最小等价于目标值处1对应的概率值最大,此时意味着预测值和目    阅读全文
        
            posted @ 2020-12-26 23:27
一杯明月
阅读(342)
评论(0)
推荐(0)
        
            
        
        
摘要:        
https://www.bilibili.com/video/BV184411Q7Ng?p=75 注解: 每个字母输出属于26个字母的概率。 注解: 经过卷积神经网络后,每个样本图片的输出应该是[4*26]个概率值。 注解: a是全连接层之后经过softmax运算后的104个概率值,b是26*4个目    阅读全文
        
            posted @ 2020-12-26 17:54
一杯明月
阅读(101)
评论(0)
推荐(0)
        
            
        
        
摘要:        
https://www.bilibili.com/video/BV184411Q7Ng?p=74 注解: 这是一个230*240的彩色图片。 卷积层相当于做特征,把特征提取出来。 为何函数使用relu(),不是sigmoid()函数了,原因: 1.sigmoid()计算量大。 如果网络深度深的话,在    阅读全文
        
            posted @ 2020-12-26 17:38
一杯明月
阅读(239)
评论(0)
推荐(0)
        
 
                    
                 
 
         浙公网安备 33010602011771号
浙公网安备 33010602011771号