随笔分类 - python
摘要:字符串匹配算法——Sunday 听到字符串匹配,我们第一想到的是经典的KMP算法,为什么会是它,因为它实在是太经典了。但是我们今天要讲的是另一个算法,Sunday算法,比KMP还要快的字符串匹配。 假设 匹配串 为$\quad$abcabdaababcbab 模式串 为$\quad$babcb 设匹
阅读全文
摘要:废话不多说,先上图: 此程序的主要目的,就是将碑文图片上的汉字截取出来,并且将文字周围多余边距去除,完成此后模式识别的先前准备工作。 用的是opencv的库,在处理噪音和二值化处理的时候方便一点。 其中涉及了一些在是使用opencv可能遇到的问题,比如矩形轮廓怎么画,用opencv提取出轮廓之后,怎
阅读全文
摘要:看官方文档: In [10]: help(np.nonzero)Help on function nonzero in module numpy.core.fromnumeric: nonzero(a) Return the indices of the elements that are non-
阅读全文
摘要:Canopy: Downloads - Enthought Scientific Computing Solutions一键安装python数据分析开发平台,预设核心科学分析库诸如:scipy, numpy,. pandas, matplotlib, Ipython等等。这个软件有免费版和几种不同的
阅读全文
摘要:原始图片是这样: 经过处理之后的效果是这样: 代码如下:
阅读全文
摘要:继之前爬取知乎用户之后,目前爬取到3.5万条数据,但是在这些数据中有一些是没有完整填写用户信息的。检索数据库中地理位置不为空的用户,进行地域统计。 其中的shengshi.txt是省市的列表,文件如下: 生成result2.txt文件结构如下,为何要生成如此结构的文件,下文有用 使用echart网站
阅读全文
摘要:这个爬虫程序有别于之前写的两个,这个是自己写的,使用的是python库requests、redis、lxml。 一共有三个文件分别是config.ini用户名和cookie配置文件,zhihusp.py爬取用户名,get-info.py爬取用户其他信息。 下面分别将三个文件贴出来,两个python文
阅读全文
摘要:首先新建一个Scrapy项目,如果不知道项目怎么建的,请看前面爬取豆瓣TOP电影那篇文章。 目录结构如下: 因为我只是爬取问题,所以item里面只有一个title项,直接上zhihu_spider.py代码: 然后从apart.txt文件里面取出这些问题,将这些问题分词,对分出的词计数。 此处用到两
阅读全文
摘要:问题: 将一个n元一维向量向左旋转i个位置。例如,当n=8且i=3时,向量abcdefgh旋转为defghabc。简单的代码使用一个n元的中间向量在n步内完成该工作。 解答: 简述原理:将问题简化成将ab转换成ba。先对a求逆得arb;再对b求逆得arbr;最后整体求逆(arbr)r得到ba。 py
阅读全文
摘要:最近学习了python的一个超级牛的库scrapy,写下一些心得。 初看的时候,看的是官方文档,讲的有些晦涩,有些地方也有模糊不清的地方,而且完整的中高级的用例不多,再由于版本更新的问题,原来的一些方法发生了一些改变,所以在博客园上找到一篇博客结合官方文档,爬出一个自己的scrapy,主要目标豆瓣电
阅读全文
摘要:Python SQLITE数据库是一款非常小巧的嵌入式开源数据库软件,也就是说没有独立的维护进程,所有的维护都来自于程序本身。它使用一个文件存储整个数据库,操作十分方便。它的最大优点是使用方便,功能相比于其它大型数据库来说,确实有些差距。但是性能表现上,SQLITE并不逊色。麻雀虽小,五脏俱全, s
阅读全文
摘要:首先安装SublimeLinter,在sublime中shift+ctrl+p,install packages:搜索sublimelinter,安装 到cmd或者powershell中适应pip安装PEP8,没有安装pip的自行Google 首先安装SublimeLinter,在sublime中s
阅读全文
摘要:首先导入模块,用help查看相关文档 接下来,看几个例子,从例子中发现规律。 规律不难发现,但是并不是万事大吉了,还需要处理特殊情况,如链接是其本身,链接中包含无效字符等
阅读全文
摘要:python的set和其他语言类似, 是一个无序不重复元素集, 基本功能包括关系测试和消除重复元素. 集合对象还支持union(联合), intersection(交), difference(差)和sysmmetric difference(对称差集)等数学运算. sets 支持 x in set
阅读全文
摘要:由于在学习python之前有过一点的编程基础,学过C、Java的一些基础知识。前面的略过不讲,从数据结构说起。 1、列表 list是处理一组有序项目的数据结构,即你可以在一个列表中存储一个序列 的项目。如: list可变,list.append('***')添加新的项;list.sort()列表排序
阅读全文

浙公网安备 33010602011771号