随笔分类 -  Python

摘要:1、基本抓取网页 2、使用代理IP 在开发爬虫过程中经常会遇到IP被封掉的情况,这时就需要用到代理IP; 在urllib2包中有ProxyHandler类,通过此类可以设置代理访问网页,如下代码片段: 3、Cookies处理 cookies是某些网站为了辨别用户身份、进行session跟踪而储存在用 阅读全文
posted @ 2016-07-21 11:45 94julia 阅读(317) 评论(0) 推荐(0)
摘要:01<blockquote>02030405类的方法:0607方法的定义,和函数定义一样,但是需要self作为地一个参数0809类的方法也有分类:公有方法和私有方法1011—私有方法:不能被外部类和方法调用,只能被自己类内部调用,定义方法为在前面加上“__"双下滑线就可以了;1213—动态方法(类方法):被classmethod()函数处理过的函数,能被类所调用,也能被对象所调用(是继承的关系)动态的,别的方法没有被加载进去,节省内存,当需要执行某一个特定的方法的时候,会去动态加载,在执行效率来说,比较慢,但节省资源;1415—静态方法:被staticmethod()函数 阅读全文
posted @ 2013-04-30 22:13 94julia 阅读(183) 评论(0) 推荐(0)
摘要:python进行文件读写的函数是open或filefile_handler = open(filename,,mode) Table mode模modedetailsr 以读方式打开文件,可读取文件信息,默认不写为r模式。w 以写方式打开文件,可向文件写入信息。如文件存在,则清空该文件,再写入新内容a 以追加模式打开文件(即一打开文件,文件指针自动移到文件末尾),如果文件不存在则创建r+ 以读写方式打开文件,可对文件进行读和写操作。w+ 消除文件内容,然后以读写方式打开文件。a+ 以读写方式打开文件,并把文件指针移到文件尾。b 以二进制模式打开文件,而不是以文本模式。该模式只对Windows或 阅读全文
posted @ 2013-04-30 22:04 94julia 阅读(209) 评论(0) 推荐(0)
摘要:1. copy.copy 浅拷贝 只拷贝父对象,不会拷贝对象的内部的子对象。2. copy.deepcopy 深拷贝 拷贝对象及其子对象用一个简单的例子说明如下:>>>import copy>>>a = [1, 2, 3, 4, ['a', 'b', 'c']]>>> b = a>>> c = copy.copy(a)>>> d = copy.deepcopy(a)很容易理解:a是一个列表,表内元素a[4]也是一个列表(也就是一个内部子对象);b是对a列表的 阅读全文
posted @ 2013-04-30 21:58 94julia 阅读(161) 评论(0) 推荐(0)
摘要:1实例:下载某URL下的jpg图片view sourceprint?01#!/usr/bin/python02importre#导入正则模块03importurllib#导入url模块0405defgetHtml(url):#获取url页面源代码06page=urllib.urlopen(url)07html=page.read()08returnhtml0910defgetImg(html):#下载url页面的jpg11reg=r'src="(.*?\.jpg)" .* width'#括号.*?里面为非贪婪匹配12imgre=re.compile(reg) 阅读全文
posted @ 2013-04-30 21:56 94julia 阅读(250) 评论(0) 推荐(0)
摘要:正则表达式(RE)是一种小型的、高度专业化的编程语言,在python中,它内嵌在python中,并通过re模块实现。字符匹配: 普通字符,大多数字母和字符一般都会和自身匹配,比如正则表达式test会和字符串"test"完全匹配 元字符, . ^ $ + ? {} [] \ | () .,表任意字符*?, +?, ?? 符合条件的情况下,匹配的尽可能少//限制*,+,?匹配的贪婪性 [],常用来指定一个字符集:[abc]; [a-z];元字符在字符集中不起作用:[akm$];补集匹配不在区间范围内的字符:[^5] ^,匹配行首 $,匹配行尾1#!/usr/bin/python 阅读全文
posted @ 2013-04-30 21:55 94julia 阅读(263) 评论(0) 推荐(0)
摘要:包和模块:模块导入,会将模块(xxx.py编译为xxx.pyc,以便于下次直接使用)Python搜索模块的路径:1) 程序的主目录2) PTYHONPATH目录(如果已经进行了设置)3) 标准连接库目录(一般在/usr/local/lib/python2.X/)4) 任何的.pth文件的内容(如果存在的话).新功能,允许用户把有效果的目录添加到模块搜索路径中去.pth后缀的文本文件中一行一行的地列出目录。这四个组建组合起来就变成了sys.path了。模块是一个可以导入的python文件;包是一堆按目录组织的模块和子包,目录下必须包含__init__.py的包信息文件,可以为空。创建包的步骤:建 阅读全文
posted @ 2013-04-30 21:52 94julia 阅读(201) 评论(0) 推荐(0)
摘要:内置函数,在python帮助文档中:Build-in Functions在Abaqus Python提示符下,输入下面语句,就会显示Python提供的内置函数列表>>>dir('__builtins__')abs() 内置函数,绝对值或复数的模。max() 找出字符串中最大的字符。如:min('find the minimum character'),返回' ',即空格。min() 找出字符串中最小的字符。如:max('find the maximum character'),返回'x'。divm 阅读全文
posted @ 2013-04-30 21:51 94julia 阅读(278) 评论(0) 推荐(0)
摘要:函数:def 函数名(参数列表): 函数体函数默认返回值为None向函数传元组和字典:fun(*args)//传元组,需要一一对应fun(**args)//传字典,需要一一对应处理多余参数:def fun(*args,**args)1#!/usr/bin/python2deffun(x,*args,**dargs):3printx4printargs5printdargs6fun(1,2,3,4,5,y=20,z=30)7输出:18(2,3,4,5)9{y:20,z:30}lambda表达式:def fun(x,y): print x*y对应的lambda表达式为:g = lambda x.. 阅读全文
posted @ 2013-04-30 21:49 94julia 阅读(213) 评论(0) 推荐(0)
摘要:流程控制-ifif 表达式: 声明和执行语句(前面一般为四个空格来缩进,并且每行缩进相同才会被认为是在if语句中,否则在if之外)01#!/usr/bin/python02deffun():03return00405x=int(raw_input('please input x'))06y=int(raw_input('please input y'))0708ifx>=90andy>=90://注意不要忘了加‘:’09print'a'10elifx>=80:11print'b'12elifx>=70:13 阅读全文
posted @ 2013-04-30 21:42 94julia 阅读(201) 评论(0) 推荐(0)
摘要:1.源代码python源代码文件以py为扩展名,由python程序解释,不需要编译。1#!/usr/bin/python2print"hello"2.字节代码python源文件经过编译后生成以pyc为扩展名的文件,编译方法:1importpy_compile2py_compile.compile('1.py')3.优化代码经过优化的源文件,以pyo为扩展名,编译方法:python -O -m py_compile 1.py执行前需要赋予可执行权限,chmod +x 1.py,然后./1.py(或python 1.py),python 1.pyc,python 阅读全文
posted @ 2013-04-30 21:40 94julia 阅读(206) 评论(0) 推荐(0)
摘要:Django 是一款高性能的Python web框架,鼓励快速开发和干净、务实的设计。 Django 项目是一个定制框架,它源自一个在线新闻 Web 站点,于 2005 年以开源的形式被释放出来。Django的重点是尽可能地自动化,坚持DRY原则。下面介绍4款基于Django 框架的开源项目:1、CMS 建站系统Django-CmsDjango-Cms 是一款基于Django框架开发的 CMS 建站系统。主要特点是简单易用,性能高。2、开源内容管理平台Mezzanine一个开源的内容管理平台,建立在Django框架上,,包括web版本和移动版本。更多见Mezzanine 文档,Mezzanin 阅读全文
posted @ 2013-03-27 18:51 94julia 阅读(857) 评论(0) 推荐(0)
摘要:交换变量1 x = 62 y = 53 4 x, y = y, x5 6 print x7 >>> 58 print y9 >>> 6if语句在行内1 print "Hello" if True else "World"2 >>> Hello连接 1 nfc = ["Packers", "49ers"] 2 afc = ["Ravens", "Patriots"] 3 print nfc + afc 4 >>& 阅读全文
posted @ 2013-03-27 15:03 94julia 阅读(187) 评论(0) 推荐(0)