摘要: 深度学习中常用的优化器简介 SGD mini batch SGD 是最基础的优化方法,是后续改良方法的基础。下式给出SGD的更新公式 $$ \theta_t = \theta_{t 1} \alpha\nabla_\theta J(\theta) $$ 其中$\alpha$是学习速率。 SGD wi 阅读全文
posted @ 2018-11-07 12:57 狂徒归来 阅读(1351) 评论(0) 推荐(0) 编辑
摘要: GloVe 模型介绍 下面的内容主要来自https://blog.csdn.net/u014665013/article/details/79642083 GloVe的推导 GloVe是基于共现信息来获得词的分布表示的,所以需要统计词的共现对信息。在设定的窗口内,统计中心词$k$与其上下文词$i$的 阅读全文
posted @ 2018-11-07 12:07 狂徒归来 阅读(555) 评论(0) 推荐(0) 编辑