随笔分类 -  python

摘要:字符串匹配算法——Sunday 听到字符串匹配,我们第一想到的是经典的KMP算法,为什么会是它,因为它实在是太经典了。但是我们今天要讲的是另一个算法,Sunday算法,比KMP还要快的字符串匹配。 假设 匹配串 为$\quad$abcabdaababcbab 模式串 为$\quad$babcb 设匹 阅读全文
posted @ 2016-10-10 18:34 phil_chow 阅读(589) 评论(0) 推荐(0)
摘要:废话不多说,先上图: 此程序的主要目的,就是将碑文图片上的汉字截取出来,并且将文字周围多余边距去除,完成此后模式识别的先前准备工作。 用的是opencv的库,在处理噪音和二值化处理的时候方便一点。 其中涉及了一些在是使用opencv可能遇到的问题,比如矩形轮廓怎么画,用opencv提取出轮廓之后,怎 阅读全文
posted @ 2016-06-23 21:32 phil_chow 阅读(2723) 评论(0) 推荐(4)
摘要:看官方文档: In [10]: help(np.nonzero)Help on function nonzero in module numpy.core.fromnumeric: nonzero(a) Return the indices of the elements that are non- 阅读全文
posted @ 2016-04-20 13:29 phil_chow 阅读(1253) 评论(0) 推荐(0)
摘要:Canopy: Downloads - Enthought Scientific Computing Solutions一键安装python数据分析开发平台,预设核心科学分析库诸如:scipy, numpy,. pandas, matplotlib, Ipython等等。这个软件有免费版和几种不同的 阅读全文
posted @ 2016-04-02 13:16 phil_chow 阅读(478) 评论(0) 推荐(1)
摘要:原始图片是这样: 经过处理之后的效果是这样: 代码如下: ​ 阅读全文
posted @ 2016-03-15 12:47 phil_chow 阅读(476) 评论(0) 推荐(0)
摘要:继之前爬取知乎用户之后,目前爬取到3.5万条数据,但是在这些数据中有一些是没有完整填写用户信息的。检索数据库中地理位置不为空的用户,进行地域统计。 其中的shengshi.txt是省市的列表,文件如下: 生成result2.txt文件结构如下,为何要生成如此结构的文件,下文有用 使用echart网站 阅读全文
posted @ 2015-12-23 16:31 phil_chow 阅读(733) 评论(0) 推荐(0)
摘要:这个爬虫程序有别于之前写的两个,这个是自己写的,使用的是python库requests、redis、lxml。 一共有三个文件分别是config.ini用户名和cookie配置文件,zhihusp.py爬取用户名,get-info.py爬取用户其他信息。 下面分别将三个文件贴出来,两个python文 阅读全文
posted @ 2015-12-08 20:56 phil_chow 阅读(2531) 评论(0) 推荐(0)
摘要:首先新建一个Scrapy项目,如果不知道项目怎么建的,请看前面爬取豆瓣TOP电影那篇文章。 目录结构如下: 因为我只是爬取问题,所以item里面只有一个title项,直接上zhihu_spider.py代码: 然后从apart.txt文件里面取出这些问题,将这些问题分词,对分出的词计数。 此处用到两 阅读全文
posted @ 2015-12-07 21:55 phil_chow 阅读(223) 评论(0) 推荐(0)
摘要:问题: 将一个n元一维向量向左旋转i个位置。例如,当n=8且i=3时,向量abcdefgh旋转为defghabc。简单的代码使用一个n元的中间向量在n步内完成该工作。 解答: 简述原理:将问题简化成将ab转换成ba。先对a求逆得arb;再对b求逆得arbr;最后整体求逆(arbr)r得到ba。 py 阅读全文
posted @ 2015-09-26 21:51 phil_chow 阅读(111) 评论(0) 推荐(0)
摘要:最近学习了python的一个超级牛的库scrapy,写下一些心得。 初看的时候,看的是官方文档,讲的有些晦涩,有些地方也有模糊不清的地方,而且完整的中高级的用例不多,再由于版本更新的问题,原来的一些方法发生了一些改变,所以在博客园上找到一篇博客结合官方文档,爬出一个自己的scrapy,主要目标豆瓣电 阅读全文
posted @ 2015-09-24 21:34 phil_chow 阅读(327) 评论(0) 推荐(0)
摘要:Python SQLITE数据库是一款非常小巧的嵌入式开源数据库软件,也就是说没有独立的维护进程,所有的维护都来自于程序本身。它使用一个文件存储整个数据库,操作十分方便。它的最大优点是使用方便,功能相比于其它大型数据库来说,确实有些差距。但是性能表现上,SQLITE并不逊色。麻雀虽小,五脏俱全, s 阅读全文
posted @ 2015-08-19 17:19 phil_chow 阅读(1598) 评论(0) 推荐(0)
摘要:首先安装SublimeLinter,在sublime中shift+ctrl+p,install packages:搜索sublimelinter,安装 到cmd或者powershell中适应pip安装PEP8,没有安装pip的自行Google 首先安装SublimeLinter,在sublime中s 阅读全文
posted @ 2015-08-19 13:22 phil_chow 阅读(1937) 评论(0) 推荐(0)
摘要:首先导入模块,用help查看相关文档 接下来,看几个例子,从例子中发现规律。 规律不难发现,但是并不是万事大吉了,还需要处理特殊情况,如链接是其本身,链接中包含无效字符等 ​ 阅读全文
posted @ 2015-08-18 18:03 phil_chow 阅读(11585) 评论(0) 推荐(2)
摘要:python的set和其他语言类似, 是一个无序不重复元素集, 基本功能包括关系测试和消除重复元素. 集合对象还支持union(联合), intersection(交), difference(差)和sysmmetric difference(对称差集)等数学运算. sets 支持 x in set 阅读全文
posted @ 2015-08-17 23:31 phil_chow 阅读(144) 评论(0) 推荐(0)
摘要:由于在学习python之前有过一点的编程基础,学过C、Java的一些基础知识。前面的略过不讲,从数据结构说起。 1、列表 list是处理一组有序项目的数据结构,即你可以在一个列表中存储一个序列 的项目。如: list可变,list.append('***')添加新的项;list.sort()列表排序 阅读全文
posted @ 2015-08-03 09:58 phil_chow 阅读(162) 评论(0) 推荐(0)