随笔分类 - 深度学习算法
摘要:最近用tensorflow写了个OCR的程序,在实现的过程中,发现自己还是跳了不少坑,在这里做一个记录,便于以后回忆。主要的内容有lstm+ctc具体的输入输出,以及TF中的CTC和百度开源的warpCTC在具体使用中的区别。 正文 输入输出 因为我最后要最小化的目标函数就是ctc_loss,所以下
阅读全文
摘要:问题描述: Tensorflow 训练时运行越来越慢,重启后又变好。 用的是Tensorflow-GPU 1.2版本,在GPU上跑,大概就是才开始训练的时候每个batch的时间很低,然后随着训练的推进,每个batch的耗时越来越长,但是当我重启后,又一切正常了? 问题查找: 一开始查到的原因是bat
阅读全文
摘要:要是关注深度学习在自然语言处理方面的研究进展,我相信你一定听说过Attention Model(后文有时会简称AM模型)这个词。AM模型应该说是过去一年来NLP领域中的重要进展之一,在很多场景被证明有效。听起来AM很高大上,其实它的基本思想是相当直观简洁的。 AM 引言: 引用网上通俗的解释,首先,
阅读全文
摘要:近些年来,随着深度学习的崛起,RNN模型也变得非常热门。如果把RNN模型按照时间轴展开,它也类似其它的深度神经网络模型结构。因此,我们可以参照已有的方法训练RNN模型。 现在最流行的一种RNN模型是LSTM(长短期记忆)网络模型。 尽管我们可以借助Tensorflow、Torch、Theano等深度
阅读全文

浙公网安备 33010602011771号