05 2019 档案

摘要:Transformer原理 论文地址:Attention Is All You Need:https://arxiv.org/abs/1706.03762 Transformer是一种完全基于Attention机制来加速深度学习训练过程的算法模型。Transformer最大的优势在于其在并行化处理上 阅读全文
posted @ 2019-05-30 20:34 Assange 阅读(434) 评论(0) 推荐(0)
摘要:注意力模型最近几年在深度学习各个领域被广泛使用,无论是图像处理、语音识别还是自然语言处理的各种不同类型的任务中,都很容易遇到注意力模型的身影。所以,了解注意力机制的工作原理对于关注深度学习技术发展的技术人员来说有很大的必要。 图1 人类的视觉注意力 从注意力模型的命名方式看,很明显其借鉴了人类的注意 阅读全文
posted @ 2019-05-28 21:58 Assange 阅读(187) 评论(0) 推荐(0)
摘要:RNN提出的背景: RNN通过每层之间节点的连接结构来记忆之前的信息,并利用这些信息来影响后面节点的输出。RNN可充分挖掘序列数据中的时序信息以及语义信息,这种在处理时序数据时比全连接神经网络和CNN更具有深度表达能力,RNN已广泛应用于语音识别、语言模型、机器翻译、时序分析等各个领域。 RNN的训 阅读全文
posted @ 2019-05-26 20:49 Assange 阅读(371) 评论(0) 推荐(0)
摘要:卷积定义: 所谓卷积,其实是一种数学运算。但是在我们的学习生涯中,往往它都是披上了一层外衣,使得我们经常知其然不知其所以然。比如在信号系统中,他是以一维卷积的形式出现描述系统脉冲响应。又比如在图像处理中,他是以二维卷积的形式出现,可以对图像进行模糊处理。乍一看,两个形式风马牛不相及,但其实他们的本质 阅读全文
posted @ 2019-05-24 21:36 Assange 阅读(352) 评论(0) 推荐(0)
摘要:BP: 正向计算loss,反向传播梯度。 计算梯度时,从输出端开始,前一层的梯度等于activation' *(与之相连的后一层的神经元梯度乘上权重的和)。 几种常见的激活函数 Sigmoid. Sigmoid(也叫逻辑激活函数) 非线性激活函数的形式是,其图形如上图左所示。之前我们说过,sigmo 阅读全文
posted @ 2019-05-22 21:10 Assange 阅读(440) 评论(0) 推荐(0)
摘要:参考:https://blog.csdn.net/u013710265/article/details/72780520 贝叶斯公式就一行: P(Y|X)=P(X|Y)P(Y)P(X) 而它其实是由以下的联合概率公式推导出来:P(Y,X)=P(Y|X)P(X)=P(X|Y)P(Y) P(X)为X的先 阅读全文
posted @ 2019-05-20 22:07 Assange 阅读(402) 评论(0) 推荐(0)
摘要:参考:https://blog.csdn.net/wxyangid/article/details/80209156 1.one-hot编码 中文名叫独热编码、一位有效编码。方法是使用N位状态寄存器来对N个状态进行编码,每个状态都有其独立的寄存器位,并且任意时刻,有且仅有一个状态位是有效的。比如,手 阅读全文
posted @ 2019-05-18 21:48 Assange 阅读(531) 评论(0) 推荐(0)
摘要:给定一个仅包含大小写字母和空格 ' ' 的字符串,返回其最后一个单词的长度。 如果不存在最后一个单词,请返回 0 。 说明:一个单词是指由字母组成,但不包含任何空格的字符串。 示例: 没过“ ”,what???先去除两端空格吧。 解: 2019-05-18 09:28:13 python: 阅读全文
posted @ 2019-05-18 09:29 Assange 阅读(225) 评论(0) 推荐(0)
摘要:给出一个无重叠的 ,按照区间起始端点排序的区间列表。 在列表中插入一个新的区间,你需要确保列表中的区间仍然有序且不重叠(如果有必要的话,可以合并区间)。 示例 1: 示例 2: 方法1:在56的基础上,采用先插入再合并的方式,过于繁琐,可以直接看方法2 方法2: 2019-05-17 18:14:2 阅读全文
posted @ 2019-05-17 18:15 Assange 阅读(292) 评论(0) 推荐(0)
摘要:给出一个区间的集合,请合并所有重叠的区间。 示例 1: 示例 2: 2019-05-17 09:55:30 阅读全文
posted @ 2019-05-17 09:56 Assange 阅读(730) 评论(0) 推荐(0)
摘要:参考:https://www.jianshu.com/p/f3b92124cd2b 互信息 衡量两个随机变量之间的相关性,两个随机变量相关信息的多少。 随机变量就是随机试验结果的量的表示,可以理解为按照某个概率分布进行取值的变量,比如袋子里随机抽取一个小球就是一个随机变量,互信息就是对x和y所有可能 阅读全文
posted @ 2019-05-16 19:50 Assange 阅读(298) 评论(0) 推荐(0)
摘要:给定一个非负整数数组,你最初位于数组的第一个位置。 数组中的每个元素代表你在该位置可以跳跃的最大长度。 判断你是否能够到达最后一个位置。 示例 1: 输入: [2,3,1,1,4] 输出: true 解释: 从位置 0 到 1 跳 1 步, 然后跳 3 步到达最后一个位置。 示例 2: 输入: [3 阅读全文
posted @ 2019-05-14 16:32 Assange 阅读(183) 评论(0) 推荐(0)
摘要:参考:https://blog.csdn.net/u012052268/article/details/77825981/ 利用jieba分词工具去除停用词: 停用词:1.在SEO中为节省空间和提高搜索效率,搜索引擎会在索引页面或处理搜索请求时自动忽略某些字或词。使用广泛,甚至是用的过于频繁的词,如 阅读全文
posted @ 2019-05-14 11:18 Assange 阅读(274) 评论(0) 推荐(0)
摘要:给定一个包含 m x n 个元素的矩阵(m 行, n 列),请按照顺时针螺旋顺序,返回矩阵中的所有元素。 示例 1: 示例 2: python: 参考:程序员代码面试指南 2019-05-13 15:47:27 2019-08-27 20:08:59 阅读全文
posted @ 2019-05-13 15:49 Assange 阅读(301) 评论(0) 推荐(0)
摘要:中文数据集THUCNews:https://pan.baidu.com/s/1hugrfRu 密码:qfud 参考:https://blog.csdn.net/SMith7412/article/details/88087819 参考:https://blog.csdn.net/u011439796 阅读全文
posted @ 2019-05-12 14:44 Assange 阅读(627) 评论(0) 推荐(0)
摘要:给定一个整数数组 nums ,找到一个具有最大和的连续子数组(子数组最少包含一个元素),返回其最大和。 示例: python版:https://www.cnblogs.com/NPC-assange/p/9358896.html 核心思想就是比较之前的和加上当前值哪个大,考虑加还是不加,如果不加就把 阅读全文
posted @ 2019-05-10 16:42 Assange 阅读(211) 评论(0) 推荐(0)
摘要:n 皇后问题研究的是如何将 n 个皇后放置在 n×n 的棋盘上,并且使皇后彼此之间不能相互攻击。 上图为 8 皇后问题的一种解法。 给定一个整数 n,返回 n 皇后不同的解决方案的数量。 示例: 2019-05-10 16:19:39 阅读全文
posted @ 2019-05-10 16:22 Assange 阅读(235) 评论(0) 推荐(0)
摘要:n 皇后问题研究的是如何将 n 个皇后放置在 n×n 的棋盘上,并且使皇后彼此之间不能相互攻击。 上图为 8 皇后问题的一种解法。 给定一个整数 n,返回所有不同的 n 皇后问题的解决方案。 每一种解法包含一个明确的 n 皇后问题的棋子放置方案,该方案中 'Q' 和 '.' 分别代表了皇后和空位。 阅读全文
posted @ 2019-05-08 20:55 Assange 阅读(304) 评论(0) 推荐(0)
摘要:实现 pow(x, n) ,即计算 x 的 n 次幂函数。 示例 1: 输入: 2.00000, 10 输出: 1024.00000 示例 2: 输入: 2.10000, 3 输出: 9.26100 示例 3: 输入: 2.00000, -2 输出: 0.25000 解释: 2-2 = 1/22 = 阅读全文
posted @ 2019-05-08 17:57 Assange 阅读(194) 评论(0) 推荐(0)
摘要:给定一个字符串数组,将字母异位词组合在一起。字母异位词指字母相同,但排列不同的字符串。 示例: 说明: 所有输入均为小写字母。 不考虑答案输出的顺序。 用map纪录res中对应元素如ate所在list的索引,当有ate的异位词出现时,初始化list,并且把已出现的它的异位词加入到list,然后把该词 阅读全文
posted @ 2019-05-07 18:10 Assange 阅读(387) 评论(0) 推荐(0)
摘要:给定一个可包含重复数字的序列,返回所有不重复的全排列。 示例: 对比46题增加了used数组,判断该数上次是否使用过。 TIME:O(N!) SPACE:O(N) 阅读全文
posted @ 2019-05-06 11:21 Assange 阅读(247) 评论(0) 推荐(0)
摘要:给定一个没有重复数字的序列,返回其所有可能的全排列。 示例: 无奈,用swap的方法从左向右滑动,直到最后结果和最初的一致停止,只适用于三位数。。。。(改进一下让每个数字作为第一位后面的进行滑动,应该可以pass,放弃) 错: 正确做法bt: 添加顺序就是[1,2,3],[1,3,2],[2,1,3 阅读全文
posted @ 2019-05-04 10:49 Assange 阅读(392) 评论(0) 推荐(0)
摘要:给定一个非负整数数组,你最初位于数组的第一个位置。 数组中的每个元素代表你在该位置可以跳跃的最大长度。 你的目标是使用最少的跳跃次数到达数组的最后一个位置。 示例: 说明: 假设你总是可以到达数组的最后一个位置。 贪心:curMax当前能走的最大长度,maxNext最终能走的最大长度 TIME:O( 阅读全文
posted @ 2019-05-03 20:27 Assange 阅读(417) 评论(0) 推荐(0)
摘要:给定一个字符串 (s) 和一个字符模式 (p) ,实现一个支持 '?' 和 '*' 的通配符匹配。 两个字符串完全匹配才算匹配成功。 说明: s 可能为空,且只包含从 a-z 的小写字母。 p 可能为空,且只包含从 a-z 的小写字母,以及字符 ? 和 *。 示例 1: 示例 2: 示例 3: 示例 阅读全文
posted @ 2019-05-03 09:42 Assange 阅读(620) 评论(0) 推荐(0)
摘要:给定两个以字符串形式表示的非负整数 num1 和 num2,返回 num1 和 num2 的乘积,它们的乘积也表示为字符串形式。 示例 1: 示例 2: 说明: 正确方法:结合算式相乘的思想 0 4 index 0 1 2 3 4 < [p1 p2] TIME:O(n*m) SPACE:O(n+m) 阅读全文
posted @ 2019-05-02 17:26 Assange 阅读(257) 评论(0) 推荐(0)
摘要:给定一个未排序的整数数组,找出其中没有出现的最小的正整数。 示例 1: 示例 2: 示例 3: 说明: 你的算法的时间复杂度应为O(n),并且只能使用常数级别的空间。 思路: case1:length == 0 return 1 case2:length == 1 case2.1 [-1] [-.. 阅读全文
posted @ 2019-05-01 21:12 Assange 阅读(336) 评论(0) 推荐(0)
摘要:给定一个数组 candidates 和一个目标数 target ,找出 candidates 中所有可以使数字和为 target 的组合。 candidates 中的每个数字在每个组合中只能使用一次。 说明: 所有数字(包括目标数)都是正整数。 解集不能包含重复的组合。 示例 1: 示例 2: 20 阅读全文
posted @ 2019-05-01 20:33 Assange 阅读(195) 评论(0) 推荐(0)