随笔分类 -  DL

Deep Learning
摘要:文章引起我关注的主要原因是在CoNLL03 NER的F1值超过BERT达到了93.09左右,名副其实的state-of-art。考虑到BERT训练的数据量和参数量都极大,而该文方法只用一个GPU训了一周,就达到了state-of-art效果,值得花时间看看。 一句话总结:使用BiLSTM模型,用动态 阅读全文
posted @ 2018-11-14 19:58 凌波微步_Arborday 阅读(1924) 评论(0) 推荐(2)
摘要:作者用游戏的暂停与继续聊明白了checkpoint的作用,在三种主流框架中演示实际使用场景,手动点赞。 转自:https://blog.floydhub.com/checkpointing-tutorial-for-tensorflow-keras-and-pytorch/ Checkpointin 阅读全文
posted @ 2018-10-03 17:30 凌波微步_Arborday 阅读(5361) 评论(0) 推荐(0)
摘要:转自:https://www.cnblogs.com/guoyaohua/p/8724433.html 郭耀华's Blog 欲穷千里目,更上一层楼项目主页:https://github.com/guoyaohua/ 博客园 首页 新随笔 联系 订阅 管理 【深度学习】深入理解Batch Norma 阅读全文
posted @ 2018-10-02 20:11 凌波微步_Arborday 阅读(227) 评论(0) 推荐(0)
摘要:转自:http://blog.csdn.net/malefactor/article/details/51078135 CNN是目前自然语言处理中和RNN并驾齐驱的两种最常见的深度学习模型。图1展示了在NLP任务中使用CNN模型的典型网络结构。一般而言,输入的字或者词用Word Embedding的 阅读全文
posted @ 2018-10-02 17:00 凌波微步_Arborday 阅读(688) 评论(0) 推荐(0)
摘要:原文链接:https://www.jianshu.com/p/55755fc649b1 如何轻松愉快地理解条件随机场(CRF)? 理解条件随机场最好的办法就是用一个现实的例子来说明它。但是目前中文的条件随机场文章鲜有这样干的,可能写文章的人都是大牛,不屑于举例子吧。于是乎,我翻译了这篇文章。希望对其 阅读全文
posted @ 2018-05-28 14:15 凌波微步_Arborday 阅读(227) 评论(0) 推荐(0)
摘要:在看CNN和RNN的相关算法TF实现,总感觉有些细枝末节理解不到位,浮在表面。那么就一点点扣细节吧。 这个作者讲方向传播也是没谁了,666~ 原文地址:https://www.cnblogs.com/charlotte77/p/5629865.html 最近在看深度学习的东西,一开始看的吴恩达的UF 阅读全文
posted @ 2018-05-15 08:21 凌波微步_Arborday 阅读(245) 评论(0) 推荐(0)