博客园 - King_Kuuid:24b78886-0ed1-41c2-8670-e3f31dcf42c4;id=1475042016-03-11T08:25:17ZKing_Khttps://www.cnblogs.com/KingKou/feed.cnblogs.comhttps://www.cnblogs.com/KingKou/p/4684468.html【leetcode】Pow(x,n) - King_K马上各种校招要开始了,怎么也得准备一下,之前一直在看看机器学习,NLP方面的东西,收获很多。最近换换脑子,回过头来做做leetcode,感觉还是蛮有意思的。今天刷了个水题,AC不高,然而难度也不高。。不知道为啥。第一次提交用了最最锉的方法,找虐的,很明显超时。于是开始想,第一个想到的就是二分,本...2015-07-28T13:49:00Z2015-07-28T13:49:00ZKing_Khttps://www.cnblogs.com/KingKou/【摘要】马上各种校招要开始了,怎么也得准备一下,之前一直在看看机器学习,NLP方面的东西,收获很多。最近换换脑子,回过头来做做leetcode,感觉还是蛮有意思的。今天刷了个水题,AC不高,然而难度也不高。。不知道为啥。第一次提交用了最最锉的方法,找虐的,很明显超时。于是开始想,第一个想到的就是二分,本... <a href="https://www.cnblogs.com/KingKou/p/4684468.html" target="_blank">阅读全文</a>https://www.cnblogs.com/KingKou/p/4567280.html学习Word2vec - King_K有感于最近接触到的一些关于深度学习的知识,遂打算找个东西来加深理解。首选的就是以前有过接触,且火爆程度非同一般的word2vec。严格来说,word2vec的三层模型还不能算是完整意义上的深度学习,本人确实也是学术能力有限,就以此为例子,打算更全面的了解一下这个工具。在此期间,参考了[1][2]...2015-06-10T13:10:00Z2015-06-10T13:10:00ZKing_Khttps://www.cnblogs.com/KingKou/【摘要】有感于最近接触到的一些关于深度学习的知识,遂打算找个东西来加深理解。首选的就是以前有过接触,且火爆程度非同一般的word2vec。严格来说,word2vec的三层模型还不能算是完整意义上的深度学习,本人确实也是学术能力有限,就以此为例子,打算更全面的了解一下这个工具。在此期间,参考了[1][2]... <a href="https://www.cnblogs.com/KingKou/p/4567280.html" target="_blank">阅读全文</a>https://www.cnblogs.com/KingKou/p/4466527.htmlLDA和PLSA - King_K看了《LDA数学八卦》和July的博客,里面涉及到好多公式推导。。。感觉好复杂,于是记录一些重点简洁的东西,忽略大批量铺垫,直接回答LDA和PLSA是区别:在pLSA模型中,我们按照如下的步骤得到“文档-词项”的生成模型(频率派):按照概率选择一篇文档选定文档后,确定文章的主题分布从主题分布中按照概...2015-04-29T09:17:00Z2015-04-29T09:17:00ZKing_Khttps://www.cnblogs.com/KingKou/【摘要】看了《LDA数学八卦》和July的博客,里面涉及到好多公式推导。。。感觉好复杂,于是记录一些重点简洁的东西,忽略大批量铺垫,直接回答LDA和PLSA是区别:在pLSA模型中,我们按照如下的步骤得到“文档-词项”的生成模型(频率派):按照概率选择一篇文档选定文档后,确定文章的主题分布从主题分布中按照概... <a href="https://www.cnblogs.com/KingKou/p/4466527.html" target="_blank">阅读全文</a>https://www.cnblogs.com/KingKou/p/4465946.htmlstanford-parser使用说明 - King_K主意:本说明文档针对stanford-parser-full-2014-06-16。不同版本的parser,其功能和表示形式可能会略有不同。但总体不会有太大差异 Stanfordparser是一款较为强大的句法解析工具,他的最初版本是java编写的,所以JDK是必须的,这玩意怎么弄就不用我说了吧。...2015-04-29T06:41:00Z2015-04-29T06:41:00ZKing_Khttps://www.cnblogs.com/KingKou/【摘要】主意:本说明文档针对stanford-parser-full-2014-06-16。不同版本的parser,其功能和表示形式可能会略有不同。但总体不会有太大差异 Stanfordparser是一款较为强大的句法解析工具,他的最初版本是java编写的,所以JDK是必须的,这玩意怎么弄就不用我说了吧。... <a href="https://www.cnblogs.com/KingKou/p/4465946.html" target="_blank">阅读全文</a>https://www.cnblogs.com/KingKou/p/4460212.html失败感言之——阿里移动推荐大赛 - King_K阿里移动推荐大赛第一轮也算是结束了,很遗憾排名631,虽然去掉前面的小号和不符合参赛要求的队伍(不是学生或者科研人员),也勉强进入了第二轮但是数据摆在那里,差距还是相当大的。作为一名合格的失败者,必须要总结下自己失败的原因。很荣幸,今年排名第一第二的两个队伍都在我们学校,通过跟他们交流,让我有机...2015-04-27T08:54:00Z2015-04-27T08:54:00ZKing_Khttps://www.cnblogs.com/KingKou/【摘要】阿里移动推荐大赛第一轮也算是结束了,很遗憾排名631,虽然去掉前面的小号和不符合参赛要求的队伍(不是学生或者科研人员),也勉强进入了第二轮但是数据摆在那里,差距还是相当大的。作为一名合格的失败者,必须要总结下自己失败的原因。很荣幸,今年排名第一第二的两个队伍都在我们学校,通过跟他们交流,让我有机... <a href="https://www.cnblogs.com/KingKou/p/4460212.html" target="_blank">阅读全文</a>https://www.cnblogs.com/KingKou/p/4333817.html【leetcode】Unique Paths - King_KA robot is located at the top-left corner of amxngrid (marked 'Start' in the diagram below).The robot can only move either down or right at any point ...2015-03-12T13:50:00Z2015-03-12T13:50:00ZKing_Khttps://www.cnblogs.com/KingKou/【摘要】A robot is located at the top-left corner of amxngrid (marked 'Start' in the diagram below).The robot can only move either down or right at any point ... <a href="https://www.cnblogs.com/KingKou/p/4333817.html" target="_blank">阅读全文</a>https://www.cnblogs.com/KingKou/p/4318055.html【leetcode】Gray Code - King_KThe gray code is a binary numeral system where two successive values differ in only one bit.Given a non-negative integernrepresenting the total number...2015-03-06T06:01:00Z2015-03-06T06:01:00ZKing_Khttps://www.cnblogs.com/KingKou/【摘要】The gray code is a binary numeral system where two successive values differ in only one bit.Given a non-negative integernrepresenting the total number... <a href="https://www.cnblogs.com/KingKou/p/4318055.html" target="_blank">阅读全文</a>https://www.cnblogs.com/KingKou/p/4315806.html【leetcode】Trapping Rain Water - King_KGivennnon-negative integers representing an elevation map where the width of each bar is 1, compute how much water it is able to trap after raining.Fo...2015-03-05T06:43:00Z2015-03-05T06:43:00ZKing_Khttps://www.cnblogs.com/KingKou/【摘要】Givennnon-negative integers representing an elevation map where the width of each bar is 1, compute how much water it is able to trap after raining.Fo... <a href="https://www.cnblogs.com/KingKou/p/4315806.html" target="_blank">阅读全文</a>https://www.cnblogs.com/KingKou/p/4271871.html【leetcode】Merge Two Sorted Lists - King_KMerge two sorted linked lists and return it as a new list. The new list should be made by splicing together the nodes of the first two lists. 题目意思很简单...2015-02-04T03:07:00Z2015-02-04T03:07:00ZKing_Khttps://www.cnblogs.com/KingKou/【摘要】Merge two sorted linked lists and return it as a new list. The new list should be made by splicing together the nodes of the first two lists. 题目意思很简单... <a href="https://www.cnblogs.com/KingKou/p/4271871.html" target="_blank">阅读全文</a>https://www.cnblogs.com/KingKou/p/4270826.html第十章 PageRank——Google的民主表决式网页排名技术 - King_K搜索引擎的结果取决于两组信息:网页的质量信息,这个查询与每个网页的相关性信息。这里,我们介绍前一个。1.PageRank算法原理 算法的原理很简单,在互联网上,如果一个网页被很多其他网页所链接,说明它收到普遍的承认和信赖,那么它的排名就高。比如我们要找李开复博士,有100个人举手说自己是李开复...2015-02-03T11:03:00Z2015-02-03T11:03:00ZKing_Khttps://www.cnblogs.com/KingKou/【摘要】搜索引擎的结果取决于两组信息:网页的质量信息,这个查询与每个网页的相关性信息。这里,我们介绍前一个。1.PageRank算法原理 算法的原理很简单,在互联网上,如果一个网页被很多其他网页所链接,说明它收到普遍的承认和信赖,那么它的排名就高。比如我们要找李开复博士,有100个人举手说自己是李开复... <a href="https://www.cnblogs.com/KingKou/p/4270826.html" target="_blank">阅读全文</a>https://www.cnblogs.com/KingKou/p/4270820.html利用sklearn进行tfidf计算 - King_K转自:http://blog.csdn.net/liuxuejiang158blog/article/details/31360765?utm_source=tuicool 在文本处理中,TF-IDF可以说是一个简单粗暴的东西。它可以用作特征抽取,关键词筛选等。 以网页搜索“核能的应...2015-02-03T10:59:00Z2015-02-03T10:59:00ZKing_Khttps://www.cnblogs.com/KingKou/【摘要】转自:http://blog.csdn.net/liuxuejiang158blog/article/details/31360765?utm_source=tuicool 在文本处理中,TF-IDF可以说是一个简单粗暴的东西。它可以用作特征抽取,关键词筛选等。 以网页搜索“核能的应... <a href="https://www.cnblogs.com/KingKou/p/4270820.html" target="_blank">阅读全文</a>https://www.cnblogs.com/KingKou/p/4242285.html【leetcode】Maximum Subarray - King_K说起这道题,第一反应就是分治算法。正如我在分治算法里写的,分三种情况递归求解,但是由于leetcode给定的参数只有一个数组,这个,貌似不能用递归吧?然后想用非递归的算法实现动态规划,但是貌似也写不出来。搞了大半天,这道题还是没解决。于是我就舍弃了这些所谓的动态规划啊,分治算法啊。用最原始的,自...2015-01-22T09:32:00Z2015-01-22T09:32:00ZKing_Khttps://www.cnblogs.com/KingKou/【摘要】说起这道题,第一反应就是分治算法。正如我在分治算法里写的,分三种情况递归求解,但是由于leetcode给定的参数只有一个数组,这个,貌似不能用递归吧?然后想用非递归的算法实现动态规划,但是貌似也写不出来。搞了大半天,这道题还是没解决。于是我就舍弃了这些所谓的动态规划啊,分治算法啊。用最原始的,自... <a href="https://www.cnblogs.com/KingKou/p/4242285.html" target="_blank">阅读全文</a>https://www.cnblogs.com/KingKou/p/4241449.html分治算法——最大子数组 - King_K表示很久没有接触算法了,好多东西真心要一点点拾掇起来,为了找份好工作,我也是蛮拼的了。 好吧,下来说说分治算法,因为在leetcode上刚好碰到这么个问题,想到要用分治做,但是一时又不清楚具体步骤。于是抱起《算法导论》啃起来。刚好上面的例子也是这个算法,就研读了一下。 假定,我们要寻找子数组...2015-01-22T05:34:00Z2015-01-22T05:34:00ZKing_Khttps://www.cnblogs.com/KingKou/【摘要】表示很久没有接触算法了,好多东西真心要一点点拾掇起来,为了找份好工作,我也是蛮拼的了。 好吧,下来说说分治算法,因为在leetcode上刚好碰到这么个问题,想到要用分治做,但是一时又不清楚具体步骤。于是抱起《算法导论》啃起来。刚好上面的例子也是这个算法,就研读了一下。 假定,我们要寻找子数组... <a href="https://www.cnblogs.com/KingKou/p/4241449.html" target="_blank">阅读全文</a>https://www.cnblogs.com/KingKou/p/4241030.htmlpython递归次数和堆栈溢出问题 - King_K在做递归的时候,测试了一下python的递归能力。 如果不设置递归次数的话,大概只能在992次左右,就会出现错误:RuntimeError: maximum recursion depth exceeded 如果使用代码: import sys sys.setrecursionli...2015-01-22T02:46:00Z2015-01-22T02:46:00ZKing_Khttps://www.cnblogs.com/KingKou/【摘要】在做递归的时候,测试了一下python的递归能力。 如果不设置递归次数的话,大概只能在992次左右,就会出现错误:RuntimeError: maximum recursion depth exceeded 如果使用代码: import sys sys.setrecursionli... <a href="https://www.cnblogs.com/KingKou/p/4241030.html" target="_blank">阅读全文</a>https://www.cnblogs.com/KingKou/p/4239554.html【leetcode】Search Insert Position - King_K题目是这样的: Given a sorted array and a target value, return the index if the target is found. If not, return the index where it would be if it were inser...2015-01-21T09:32:00Z2015-01-21T09:32:00ZKing_Khttps://www.cnblogs.com/KingKou/【摘要】题目是这样的: Given a sorted array and a target value, return the index if the target is found. If not, return the index where it would be if it were inser... <a href="https://www.cnblogs.com/KingKou/p/4239554.html" target="_blank">阅读全文</a>https://www.cnblogs.com/KingKou/p/4207107.html【leetcode】Linked List Cycle - King_K这个题真是坑死了,只怪自己不好吧。一开始审题,以为是给定一个首尾相连的链表,查看其中是否有循环(原谅我的无知吧!!)。然后在那写啊写啊写,还在纠结是局部循环还是前一半和后一半一样这样的循环,blah blah....,此处省略各种YY。最后发现其实就是给定一个链表的头,判断这个链表是否环! 1...2015-01-07T01:36:00Z2015-01-07T01:36:00ZKing_Khttps://www.cnblogs.com/KingKou/【摘要】这个题真是坑死了,只怪自己不好吧。一开始审题,以为是给定一个首尾相连的链表,查看其中是否有循环(原谅我的无知吧!!)。然后在那写啊写啊写,还在纠结是局部循环还是前一半和后一半一样这样的循环,blah blah....,此处省略各种YY。最后发现其实就是给定一个链表的头,判断这个链表是否环! 1... <a href="https://www.cnblogs.com/KingKou/p/4207107.html" target="_blank">阅读全文</a>https://www.cnblogs.com/KingKou/p/4126344.htmlwordnet的一些入门性介绍 - King_K关于wordnet的介绍很多,中英文都有,我这里主要是参考了别人的。自己组织了一下。1.简介1.1关于词典 Wordnet是一个由普林斯顿大学认识科学实验室在心理学教授乔治·A·米勒的指导下建立和维护的大型的英语词典,WordNet的开发有两个目的: 1.它既是一个字典,又是一个辞典,它比单纯的...2014-11-27T06:37:00Z2014-11-27T06:37:00ZKing_Khttps://www.cnblogs.com/KingKou/【摘要】关于wordnet的介绍很多,中英文都有,我这里主要是参考了别人的。自己组织了一下。1.简介1.1关于词典 Wordnet是一个由普林斯顿大学认识科学实验室在心理学教授乔治·A·米勒的指导下建立和维护的大型的英语词典,WordNet的开发有两个目的: 1.它既是一个字典,又是一个辞典,它比单纯的... <a href="https://www.cnblogs.com/KingKou/p/4126344.html" target="_blank">阅读全文</a>https://www.cnblogs.com/KingKou/p/4121373.htmlWordnet的一些简单使用 - King_K转载请说明出处:http://www.cnblogs.com/KingKou/p/4121373.html1.简介 Wordnet是一个由普林斯顿大学认识科学实验室在心理学教授乔治·A·米勒的指导下建立和维护的大型的英语词典,WordNet的开发有两个目的: 1.它既是一个字典,又是一个辞典,它...2014-11-25T08:49:00Z2014-11-25T08:49:00ZKing_Khttps://www.cnblogs.com/KingKou/【摘要】转载请说明出处:http://www.cnblogs.com/KingKou/p/4121373.html1.简介 Wordnet是一个由普林斯顿大学认识科学实验室在心理学教授乔治·A·米勒的指导下建立和维护的大型的英语词典,WordNet的开发有两个目的: 1.它既是一个字典,又是一个辞典,它... <a href="https://www.cnblogs.com/KingKou/p/4121373.html" target="_blank">阅读全文</a>https://www.cnblogs.com/KingKou/p/4055312.html第九章:图论和网络爬虫 - King_K上面我们谈了在搜索引擎中,如何建立索引,这里,我们讲如何自动下载互联网上所有的网页,重点就是图论中的遍历算法。 1.图论和网络爬虫 遍历算法主要有两种,一种是深度优先遍历,一种是广度优先遍历。所谓深度优先遍历,就是从一个节点开始,一直沿着一条路走到底,直到没路了,再回过头去找别的路,再一路走...2014-10-27T13:52:00Z2014-10-27T13:52:00ZKing_Khttps://www.cnblogs.com/KingKou/【摘要】上面我们谈了在搜索引擎中,如何建立索引,这里,我们讲如何自动下载互联网上所有的网页,重点就是图论中的遍历算法。 1.图论和网络爬虫 遍历算法主要有两种,一种是深度优先遍历,一种是广度优先遍历。所谓深度优先遍历,就是从一个节点开始,一直沿着一条路走到底,直到没路了,再回过头去找别的路,再一路走... <a href="https://www.cnblogs.com/KingKou/p/4055312.html" target="_blank">阅读全文</a>https://www.cnblogs.com/KingKou/p/4055282.html自动文档摘要技术简介 - King_K自动摘要生成技术,尤其是多文档摘要的研究目前来说一直深受关注。从定义上来说,多文档摘要就是将同一主题下的多个文本描述的主要信息按压缩比提炼出一个文本的自然语言处理技术。从应用上来说,一方面,在互联网上使用搜索引擎时候,搜索同一主题的文档往往会返回成千上万的网页,如果将这些网页形成一个统一的、精炼...2014-10-27T13:48:00Z2014-10-27T13:48:00ZKing_Khttps://www.cnblogs.com/KingKou/【摘要】自动摘要生成技术,尤其是多文档摘要的研究目前来说一直深受关注。从定义上来说,多文档摘要就是将同一主题下的多个文本描述的主要信息按压缩比提炼出一个文本的自然语言处理技术。从应用上来说,一方面,在互联网上使用搜索引擎时候,搜索同一主题的文档往往会返回成千上万的网页,如果将这些网页形成一个统一的、精炼... <a href="https://www.cnblogs.com/KingKou/p/4055282.html" target="_blank">阅读全文</a>