随笔分类 -  python

摘要:python之map、filter、reduce、lambda函数 转 http://www.cnblogs.com/kaituorensheng/p/5300340.html 阅读目录 map filter reduce lambda 回到顶部 map map函数根据提供的函数对指定的序列做映射, 阅读全文
posted @ 2016-11-02 11:16 任飞儿 阅读(315) 评论(0) 推荐(0)
摘要:url 编码 urllib.quote('啊啊'.encode('utf-8', 'replace')) url 编码 阅读全文
posted @ 2016-11-01 10:45 任飞儿 阅读(114) 评论(0) 推荐(0)
摘要:1.下载 pyocr-0.4.1.tar.gz tar.gz文件 解压 放到 c:/python27 文件夹下面 C:\Python27\pyocr-0.4.1 直接 cmd 命令 进入 pyocr-0.4.1 底下 执行 python setup.py install 阅读全文
posted @ 2016-10-27 09:58 任飞儿 阅读(284) 评论(0) 推荐(0)
摘要:1.报文头信息: User-Agent Accept-Language 防盗链 上referer 随机生成不同的User-Agent构造报头 2.加抓取等待时间 每抓取一页都让它随机休息几秒,加入此句代码后,每个时间段都能爬取大量股票数据了。 3.带cookie数据 4.需要登录的网站 登陆的网站  阅读全文
posted @ 2016-10-09 17:15 任飞儿 阅读(495) 评论(0) 推荐(0)
摘要:原地址:http://www.cnblogs.com/twinsclover/archive/2012/04/26/2471704.html 序言 之前用python爬取网页的时候,一直用的是regex或者自带的库sgmllib里的SGMLParser。但是遇到复杂一点的情况时,SGMLParser 阅读全文
posted @ 2016-09-29 18:09 任飞儿 阅读(1143) 评论(0) 推荐(0)
摘要:casperjs不支持phantomjs 2.x 版本解决方案 暂无评论 遇到的问题如题: 首先,安装完成后,直接运行报错如下: 1 CasperJS needs PhantomJS v1.x 解决方式,去掉casperjs的版本限制代码,代码所在目录casperjs\bin\bootstrap.j 阅读全文
posted @ 2016-09-18 14:26 任飞儿 阅读(898) 评论(0) 推荐(0)
摘要:system = require('system') //传递一些需要的参数给js文件 address = system.args[1];//获得命令行第二个参数 ,也就是指定要加载的页面地址,接下来会用到 var page = require('webpage').create(); var ur 阅读全文
posted @ 2016-09-14 17:04 任飞儿 阅读(2038) 评论(0) 推荐(0)
摘要:python3 requests 安装包下载安装[windows] 听语音 | 浏览:54 | 更新:2016-07-25 17:09 python3 requests 安装包下载安装[windows] 听语音 | 浏览:54 | 更新:2016-07-25 17:09 windows下直接使用:e 阅读全文
posted @ 2016-09-09 18:07 任飞儿 阅读(3386) 评论(0) 推荐(0)
摘要:*args 没有key值,**kwargs有key值 阅读全文
posted @ 2016-09-07 16:51 任飞儿 阅读(372) 评论(0) 推荐(0)
摘要:import csv fieldnames = ['Column1', 'Column2', 'Column3', 'Column4'] rows = [{'Column1': '0', 'Column2': '1', 'Column3': '2', 'Column4':  阅读全文
posted @ 2016-08-24 11:13 任飞儿 阅读(7436) 评论(0) 推荐(0)
摘要:[转]用Python读写Excel文件 转自:http://www.gocalf.com/blog/python-read-write-excel.html#xlrd-xlwt 虽然天天跟数据打交道,也频繁地使用Excel进行一些简单的数据处理和展示,但长期以来总是小心地避免用Python直接读写E 阅读全文
posted @ 2016-08-24 11:10 任飞儿 阅读(2156) 评论(0) 推荐(0)
摘要:Python中使用Beautiful Soup库的超详细教程 转 http://www.jb51.net/article/65287.htm 作者:崔庆才 字体:[增加 减小] 类型:转载 时间:2015-04-30 我要评论 Python中使用Beautiful Soup库的超详细教程 转 htt 阅读全文
posted @ 2016-08-23 16:05 任飞儿 阅读(219) 评论(0) 推荐(0)
摘要:Chardet,字符编码探测器,可以自动检测文本、网页、xml的编码。 colorama,主要用来给文本添加各种颜色,并且非常简单易用。 Prettytable,主要用于在终端或浏览器端构建格式化的输出。 difflib,Python标准库,计算文本差异 Levenshtein,快速计算字符串相似度 阅读全文
posted @ 2016-08-19 14:33 任飞儿 阅读(6366) 评论(0) 推荐(0)
摘要:平常一般都在Linux下用Python,今天女票突然说让帮忙把一些图片全部弄成一个分辨率的,作为程序员,这种重复的工作还是交给计算机吧。 废话不多说,打开Cmd看下Windows的python下面是否有PIL(python imaging library)这个库,很不辛,木有。 于是到 PIL官网  阅读全文
posted @ 2016-08-09 15:51 任飞儿 阅读(556) 评论(0) 推荐(0)
摘要:第三方模块: 阅读全文
posted @ 2016-07-20 10:32 任飞儿 阅读(203) 评论(0) 推荐(0)
摘要:soup = BeautifulSoup(respHtml, fromEncoding=htmlCharset); 阅读全文
posted @ 2016-07-20 10:04 任飞儿 阅读(691) 评论(0) 推荐(0)
摘要:Python3学习笔记(urllib模块的使用) 1.基本方法 urllib.request.urlopen(url, data=None, [timeout, ]*, cafile=None, capath=None, cadefault=False, context=None) - url: 需 阅读全文
posted @ 2016-05-19 17:51 任飞儿 阅读(253) 评论(0) 推荐(0)
摘要:#coding=utf-8 import urllib import re def getHtml(url): page = urllib.urlopen(url) html = page.read() return html def getImg(html): reg = r'src="(.+?\ 阅读全文
posted @ 2016-05-03 16:31 任飞儿 阅读(219) 评论(0) 推荐(0)
摘要:1.dict 字典对象 a.定义对象 d={'a':14,'b':12}b.通过key获取value d['a'] 方法1.判断key是否存在 if 'a' in d: d['a']方法2:通过用get方法获取 如果不存在则返回none数据d.get('a'); dict 查找速度快 list随着元 阅读全文
posted @ 2016-04-13 17:35 任飞儿 阅读(2399) 评论(0) 推荐(0)
摘要:1.tuple对象 tuple 元组 有序的列表 tuple一旦创建不能修改 a.定义元组t=('a','b','c')空元素的tuple t=()()既表示tuple 也表示运算符的优先级 所以定义一个元素的tuple的 时候加个逗号 如 t=(1,) 可变的tuple t=('a','b',[' 阅读全文
posted @ 2016-04-13 17:27 任飞儿 阅读(257) 评论(0) 推荐(0)