摘要: 摘要: 本文讲的是用深度学习解决自然语言处理中的7大问题,文本分类、语言建模、机器翻译等,自然语言处理领域正在从统计学方法转向神经网络方法。在自然语言中,仍然存在许多具有挑战性的问题。但是,深度学习方法在某些特定的语言问题上取得了state-of-the-art的结果。 本文讲的是用深度学习解决自然 阅读全文
posted @ 2018-11-19 09:54 Alan_Fire 阅读(731) 评论(0) 推荐(0)
摘要: [神经网络]反向传播梯度计算数学原理 1 文章概述 本文通过一段来自于Pytorch官方的warm-up的例子:使用numpy来实现一个简单的神经网络。使用基本的数学原理,对其计算过程进行理论推导,以揭示这几句神奇的代码后面所包含的原理。 估计对大多数的同学来说,看完这个文章,肯定会是这样的感觉:字 阅读全文
posted @ 2018-11-19 09:50 Alan_Fire 阅读(740) 评论(0) 推荐(0)
摘要: 矩阵求导的技术,在统计学、控制论、机器学习等领域有广泛的应用。鉴于我看过的一些资料或言之不详、或繁乱无绪,本文来做个科普,分作两篇,上篇讲标量对矩阵的求导术,下篇讲矩阵对矩阵的求导术。本文使用小写字母x表示标量,粗体小写字母表示(列)向量,大写字母X表示矩阵。 首先来琢磨一下定义,标量f对矩阵X的导 阅读全文
posted @ 2018-11-19 09:41 Alan_Fire 阅读(1178) 评论(0) 推荐(0)