King_K

导航

2015年2月3日 #

利用sklearn进行tfidf计算

摘要: 转自:http://blog.csdn.net/liuxuejiang158blog/article/details/31360765?utm_source=tuicool 在文本处理中,TF-IDF可以说是一个简单粗暴的东西。它可以用作特征抽取,关键词筛选等。 以网页搜索“核能的应... 阅读全文

posted @ 2015-02-03 18:59 King_K 阅读(10556) 评论(0) 推荐(0) 编辑

2015年1月22日 #

【leetcode】Maximum Subarray

摘要: 说起这道题,第一反应就是分治算法。正如我在分治算法里写的,分三种情况递归求解,但是由于leetcode给定的参数只有一个数组,这个,貌似不能用递归吧?然后想用非递归的算法实现动态规划,但是貌似也写不出来。搞了大半天,这道题还是没解决。于是我就舍弃了这些所谓的动态规划啊,分治算法啊。用最原始的,自... 阅读全文

posted @ 2015-01-22 17:32 King_K 阅读(208) 评论(0) 推荐(0) 编辑

分治算法——最大子数组

摘要: 表示很久没有接触算法了,好多东西真心要一点点拾掇起来,为了找份好工作,我也是蛮拼的了。 好吧,下来说说分治算法,因为在leetcode上刚好碰到这么个问题,想到要用分治做,但是一时又不清楚具体步骤。于是抱起《算法导论》啃起来。刚好上面的例子也是这个算法,就研读了一下。 假定,我们要寻找子数组... 阅读全文

posted @ 2015-01-22 13:34 King_K 阅读(1261) 评论(0) 推荐(0) 编辑

python递归次数和堆栈溢出问题

摘要: 在做递归的时候,测试了一下python的递归能力。 如果不设置递归次数的话,大概只能在992次左右,就会出现错误:RuntimeError: maximum recursion depth exceeded 如果使用代码: import sys sys.setrecursionli... 阅读全文

posted @ 2015-01-22 10:46 King_K 阅读(1323) 评论(0) 推荐(0) 编辑

2015年1月21日 #

【leetcode】Search Insert Position

摘要: 题目是这样的: Given a sorted array and a target value, return the index if the target is found. If not, return the index where it would be if it were inser... 阅读全文

posted @ 2015-01-21 17:32 King_K 阅读(166) 评论(0) 推荐(0) 编辑

2015年1月7日 #

【leetcode】Linked List Cycle

摘要: 这个题真是坑死了,只怪自己不好吧。一开始审题,以为是给定一个首尾相连的链表,查看其中是否有循环(原谅我的无知吧!!)。然后在那写啊写啊写,还在纠结是局部循环还是前一半和后一半一样这样的循环,blah blah....,此处省略各种YY。最后发现其实就是给定一个链表的头,判断这个链表是否环! 1... 阅读全文

posted @ 2015-01-07 09:36 King_K 阅读(163) 评论(0) 推荐(0) 编辑

2014年11月27日 #

wordnet的一些入门性介绍

摘要: 关于wordnet的介绍很多,中英文都有,我这里主要是参考了别人的。自己组织了一下。1.简介1.1关于词典 Wordnet是一个由普林斯顿大学认识科学实验室在心理学教授乔治·A·米勒的指导下建立和维护的大型的英语词典,WordNet的开发有两个目的: 1.它既是一个字典,又是一个辞典,它比单纯的... 阅读全文

posted @ 2014-11-27 14:37 King_K 阅读(3594) 评论(0) 推荐(0) 编辑

2014年11月25日 #

Wordnet的一些简单使用

摘要: 转载请说明出处:http://www.cnblogs.com/KingKou/p/4121373.html1.简介 Wordnet是一个由普林斯顿大学认识科学实验室在心理学教授乔治·A·米勒的指导下建立和维护的大型的英语词典,WordNet的开发有两个目的: 1.它既是一个字典,又是一个辞典,它... 阅读全文

posted @ 2014-11-25 16:49 King_K 阅读(9295) 评论(1) 推荐(0) 编辑

2014年10月27日 #

第九章:图论和网络爬虫

摘要: 上面我们谈了在搜索引擎中,如何建立索引,这里,我们讲如何自动下载互联网上所有的网页,重点就是图论中的遍历算法。 1.图论和网络爬虫 遍历算法主要有两种,一种是深度优先遍历,一种是广度优先遍历。所谓深度优先遍历,就是从一个节点开始,一直沿着一条路走到底,直到没路了,再回过头去找别的路,再一路走... 阅读全文

posted @ 2014-10-27 21:52 King_K 阅读(421) 评论(0) 推荐(0) 编辑

自动文档摘要技术简介

摘要: 自动摘要生成技术,尤其是多文档摘要的研究目前来说一直深受关注。从定义上来说,多文档摘要就是将同一主题下的多个文本描述的主要信息按压缩比提炼出一个文本的自然语言处理技术。从应用上来说,一方面,在互联网上使用搜索引擎时候,搜索同一主题的文档往往会返回成千上万的网页,如果将这些网页形成一个统一的、精炼... 阅读全文

posted @ 2014-10-27 21:48 King_K 阅读(920) 评论(0) 推荐(0) 编辑