Word2Vec实现原理(Hierarchical Softmax)
摘要:由于word2vec有两种改进方法,一种是基于Hierarchical Softmax的,另一种是基于Negative Sampling的。本文关注于基于Hierarchical Softmax的改进方法,在下一篇讨论基于Negative Sampling的改进方法。 1. 基于Hierarchic
阅读全文
TextRank算法
摘要:TextRank是一种用来做关键词提取的算法,也可以用于提取短语和自动摘要。因为TextRank是基于PageRank的,所以首先简要介绍下PageRank算法。 (1)PageRank PageRank设计之初是用于Google的网页排名的,以该公司创办人拉里·佩奇(Larry Page)之姓来命
阅读全文
leetcode第72题:编辑距离
摘要:给定两个单词 word1 和 word2,计算出将 word1 转换成 word2 所使用的最少操作数 。 你可以对一个单词进行如下三种操作: 示例 1: 示例 2: 首先定义状态矩阵,dp[m][n],其中m为word1的长度+1,n为word2的长度+1,为什么+1?因为要考虑如果word1或w
阅读全文
求二叉树中距离最大的两个节点
摘要:给定一个二叉树,求出该二叉树中任意两个节点的最远距离(两个节点的距离是指两个节点之间边的条数,可能不过根节点。) 如下图所示的二叉树的最远距离是3
阅读全文
网易有道面试总结
摘要:此次算是网易的秋招补录了吧,也不知道从哪里把我挖出来,让我去面试。面试的岗位是数据挖掘,总共有四轮面试,全是技术面试,岗位虽然是数据挖掘,但是面试官问的问题绝大多数是偏自然语言处理的, 面试的内容不再一一阐述,下面就其中个人觉得比较有意思的问题作以下记录。 1.第一个问题是拼写纠正问题,面试官写了这
阅读全文
leetcode57:插入区间
摘要:给出一个无重叠的 ,按照区间起始端点排序的区间列表。 在列表中插入一个新的区间,你需要确保列表中的区间仍然有序且不重叠(如果有必要的话,可以合并区间)。 示例 1: 示例 2:
阅读全文
leetcode56:合并区间
摘要:给出一个区间的集合,请合并所有重叠的区间。(解题思想来源于:https://blog.csdn.net/qq_34364995/article/details/80788049 ) 示例 1: 示例 2: 1.将intervals按每一个元素的start进行升序排列。 2.此时后一个值的start一
阅读全文
leetcode55:跳跃游戏
摘要:解题思路1: 从头往后找每一个为0的元素,判断这个0能够跳过,所有的0都能跳过,则返回True,否则返回False 解题思路2: 从前往后遍历数组,设置一个访问到当前位置i时最远可调到的距离maxlengh,maxlengh如果大于等于数组长度,则返回True,如果访问的位置i赶上maxlengh时
阅读全文
梯度下降各种优化算法的比较
摘要:深度学习最全优化方法总结比较(SGD,Adagrad,Adadelta,Adam,Adamax,Nadam) 直接上别人的博客吧,哈哈,太懒了。。。。 https://zhuanlan.zhihu.com/p/32626442 https://zhuanlan.zhihu.com/p/2225227
阅读全文
计数排序
摘要:计数排序是一种O(n)的排序算法,其思路是开一个长度为 maxValue-minValue+1 的数组,然后 分配。扫描一遍原始数组,以当前值- minValue 作为下标,将该下标的计数器增1。收集。扫描一遍计数器数组,按顺序把值收集起来。举个例子, nums=[2, 1, 3, 1, 5] ,
阅读全文
桶排序
摘要:桶排序的基本思想是:把数组 arr 划分为n个大小相同子区间(桶),每个子区间各自排序,最后合并。计数排序是桶排序的一种特殊情况,可以把计数排序当成每个桶里只有一个元素的情况。 针对输入数据均匀分布的特点,因此将数据分布的区间可以均匀分为n个子区间。那么就有: max - min = n * wid
阅读全文
给定两个数组,这两个数组是排序好的,让你求这两个数组合到一起之后第K大的数。
摘要:题目:给定两个数组,这两个数组是排序好的,让你求这两个数组合到一起之后第K大的数。 解题思路: 首先取得数组a的中位数a[aMid],然后在b中二分查找a[aMid],得到b[bMid],b[bSt]到b[bMid]的数小于等于a[aMid],b[bMid+1]到b[bEd]大于等于a[aMid],
阅读全文