02 2017 档案

摘要:Dropout是深度学习中防止过拟合的一项非常常见的技术,是hinton大神在12年提出的一篇论文里所采用的方法。有传言hinton大神的数学功底不是很好,所以他所提出的想法背后的数学原理并不是很复杂,往往采用简单但是非常巧妙的方法而取得非常好的效果。Dropout就是这么一种牛逼的方法。 工作原理 阅读全文

posted @ 2017-02-21 12:54 unclelin 阅读(937) 评论(0) 推荐(0)

摘要:最近用OCR识别身份证,用的tesseract引擎。但是google自带的中文库是在太慢了,尤其是对于性别、民族这样结果可以穷举的特征信息而言,完全可以自己训练字库。自己训练字库不仅可以提高识别速度,而且可以提高识别精度! 在训练过程中,常见的error有以下几种: 1)index >= 0 && 阅读全文

posted @ 2017-02-21 12:11 unclelin 阅读(560) 评论(0) 推荐(0)

摘要:Step1:安装homebrew 如果电脑上有,暂时不装。但是在step2(或者其他需要brew的情况)加完sudo之后如果仍然报错,就需要重新安装homebrew。在终端里输入如下命令: ruby -e “$(curl -fsSL https://raw.githubusercontent.com 阅读全文

posted @ 2017-02-09 23:20 unclelin 阅读(1161) 评论(0) 推荐(0)

摘要:深度学习由于超参数的个数比较多,训练样本数目相对超参数来说略显不足,一不小心就容易发生过拟合。从本质上来说,过拟合是因为模型的学习能力太强,除了学习到了样本空间的共有特性外,还学习到了训练样本集上的噪声。因为这些噪声的存在,导致了模型的泛化性能下降。在深度学习中如何克服过拟合的问题呢?一般来说有以下 阅读全文

posted @ 2017-02-09 23:19 unclelin 阅读(4961) 评论(0) 推荐(0)

导航