随笔档案「2018年12月9日」：L1 正则为什么会使参数偏向稀疏 ... - hyserendipity

2018年12月9日

摘要： 2018-12-09 22:18:43 假设费用函数 L 与某个参数 x 的关系如图所示：则最优的 x 在绿点处，x 非零。现在施加 L2 regularization，新的费用函数（）如图中蓝线所示：最优的 x 在黄点处，x 的绝对值减小了，但依然非零。而如果施加 L1 regulariz 阅读全文

posted @ 2018-12-09 22:21 hyserendipity 阅读(764) 评论(0) 推荐(0)

Inception网络

摘要： 2018-12-09 19:39:38 一、1 * 1卷积 pooling可以对feature map的height，width进行修改，但是对通道数目无法修改。 1 * 1卷积可以在不改变图像大小的前提下修改通道数目。并且如果使用多个1 * 1卷积可以起到类似FC的功能，因此1 * 1卷积也被称为阅读全文

posted @ 2018-12-09 21:27 hyserendipity 阅读(753) 评论(0) 推荐(0)

ResNet

摘要： 2018-12-09 19:07:29 深层的深度学习网络存在梯度消失和梯度爆炸等问题导致难以进行训练。 ResNet提出了Skip-Connection来将某一层的输入直接传递到更深的层，通过这种方式可以训练得到更深的神经网络。为什么这个是有效的呢？理论上，更深的模型的训练误差不应当大于浅层模阅读全文

posted @ 2018-12-09 19:37 hyserendipity 阅读(293) 评论(0) 推荐(0)

概率-拒绝采样 Rejection Sampling

摘要： 2018-12-09 16:40:30 一、使用Rand7()来生成Rand10() 问题描述：问题求解：这个问题字节跳动算法岗面试有问到类似的，有rand6，求rand8，我想了好久，最后给了一个特殊解法，就进行三次，每次取前三个数和后三个数的概率相等为1 / 2，那么最后需要得到的概率是1 阅读全文

posted @ 2018-12-09 18:21 hyserendipity 阅读(1314) 评论(0) 推荐(0)

hyserendipity

公告