随笔档案「2017年2月」 - unclelin

dropout理解：1神带9坑

摘要：Dropout是深度学习中防止过拟合的一项非常常见的技术，是hinton大神在12年提出的一篇论文里所采用的方法。有传言hinton大神的数学功底不是很好，所以他所提出的想法背后的数学原理并不是很复杂，往往采用简单但是非常巧妙的方法而取得非常好的效果。Dropout就是这么一种牛逼的方法。工作原理阅读全文

posted @ 2017-02-21 12:54 unclelin 阅读(945) 评论(0) 推荐(0)

tesserat训练中文备忘录

摘要：最近用OCR识别身份证，用的tesseract引擎。但是google自带的中文库是在太慢了，尤其是对于性别、民族这样结果可以穷举的特征信息而言，完全可以自己训练字库。自己训练字库不仅可以提高识别速度，而且可以提高识别精度！在训练过程中，常见的error有以下几种： 1）index >= 0 && 阅读全文

posted @ 2017-02-21 12:11 unclelin 阅读(563) 评论(0) 推荐(0)

mac下配置caffe

摘要：Step1:安装homebrew 如果电脑上有，暂时不装。但是在step2（或者其他需要brew的情况）加完sudo之后如果仍然报错，就需要重新安装homebrew。在终端里输入如下命令： ruby -e “$(curl -fsSL https://raw.githubusercontent.com 阅读全文

posted @ 2017-02-09 23:20 unclelin 阅读(1163) 评论(0) 推荐(0)

深度学习中防止过拟合的方法

摘要：深度学习由于超参数的个数比较多，训练样本数目相对超参数来说略显不足，一不小心就容易发生过拟合。从本质上来说，过拟合是因为模型的学习能力太强，除了学习到了样本空间的共有特性外，还学习到了训练样本集上的噪声。因为这些噪声的存在，导致了模型的泛化性能下降。在深度学习中如何克服过拟合的问题呢？一般来说有以下阅读全文

posted @ 2017-02-09 23:19 unclelin 阅读(4980) 评论(0) 推荐(0)

unclelin

02 2017 档案

导航

公告