2020年12月26日
摘要: https://www.bilibili.com/video/BV184411Q7Ng?p=76 注解: 让交叉熵损失值最小等价于目标值处1对应的概率值最大,直觉上看相当于是强制拟合一个非线性函数,或者说强符合一个非线性函数。 让交叉熵损失值最小等价于目标值处1对应的概率值最大,此时意味着预测值和目 阅读全文
posted @ 2020-12-26 23:27 一杯明月 阅读(273) 评论(0) 推荐(0) 编辑
摘要: https://www.bilibili.com/video/BV184411Q7Ng?p=75 注解: 每个字母输出属于26个字母的概率。 注解: 经过卷积神经网络后,每个样本图片的输出应该是[4*26]个概率值。 注解: a是全连接层之后经过softmax运算后的104个概率值,b是26*4个目 阅读全文
posted @ 2020-12-26 17:54 一杯明月 阅读(80) 评论(0) 推荐(0) 编辑
摘要: https://www.bilibili.com/video/BV184411Q7Ng?p=74 注解: 这是一个230*240的彩色图片。 卷积层相当于做特征,把特征提取出来。 为何函数使用relu(),不是sigmoid()函数了,原因: 1.sigmoid()计算量大。 如果网络深度深的话,在 阅读全文
posted @ 2020-12-26 17:38 一杯明月 阅读(209) 评论(0) 推荐(0) 编辑