随笔分类 -  Python

摘要:01.#!/usr/bin/env python 02.# -*- coding: utf-8 -*- 03.import re 04. 05.def regex(): 06. str = 'abcdab' 07. patstr = 'ab' 08. ... 阅读全文
posted @ 2014-04-11 18:38 vivianC 阅读(334) 评论(0) 推荐(0)
摘要:1. map函数func作用于给定序列的每个元素,并用一个列表来提供返回值。 map函数python实现代码:def map(func,seq): mapped_seq = [] for eachItem in seq: mapped_seq.append(func(eachItem)) return mapped_seq #-*-coding:utf-8-*-def add(x,y): return x+yprint map(add, range(8),range(8))2. filter函数的功能相当于过滤器。调用一个布尔函数bool_func来迭代遍历每个... 阅读全文
posted @ 2014-04-11 09:47 vivianC 阅读(228) 评论(0) 推荐(0)
摘要:os.path.abspath(path) #返回绝对路径os.path.basename(path) #返回文件名os.path.commonprefix(list) #返回list(多个路径)中,所有path共有的最长的路径。os.path.dirname(path) #返回文件路径os.path.exists(path) #路径存在则返回True,路径损坏返回Falseos.path.lexists #路径存在则返回True,路径损坏也返回Trueos.path.expanduser(path) #把path中包含的"~"和"~user"转换成用户 阅读全文
posted @ 2014-01-09 09:32 vivianC 阅读(224) 评论(0) 推荐(0)
摘要:优雅、清晰和务实都是python的核心价值观,如果想通过操作和处理一个序列(或其他的可迭代对象)来创建一个新的列表时可以使用列表解析( List comprehensions)和生成表达式,通过这两个操作,我们可以看到这三个观点是如何在python中和谐统一起来的。列表解析在需要改变列表而不是需要新建某列表时,可以使用列表解析。列表解析表达式为: [expr for iter_var in iterable] [expr for iter_var in iterable if cond_expr] 第一种语法:首先迭代iterable里所有内容,每一次迭代,都把iterable里相应内容放到. 阅读全文
posted @ 2013-12-09 10:54 vivianC 阅读(618) 评论(0) 推荐(0)
摘要:http://blog.csdn.net/adupt/article/details/4435615http://docs.python.org/release/2.5.2/lib/bltin-file-objects.htmlhttp://blog.csdn.net/firlc/article/details/69568041.open使用open打开文件后一定要记得调用文件对象的close()方法。比如可以用try/finally语句来确保最后能关闭文件。file_object=open('thefile.txt')try: all_the_text=file_object 阅读全文
posted @ 2013-12-03 15:38 vivianC 阅读(232) 评论(0) 推荐(0)
摘要:shelve,cPickle模块close() 关闭文件对象flush() 刷新文件的缓冲区。缓冲区包含等待写入或文件中读取的信息。“刷新“就是执行实际的读取或写入操作isatty() 如果文件对象是tty(终端)设备,就返回1read([size]) 从文件中读取数据。readline([size]) 从文件中读取一行readlines([size]) 从文件中读取多行seek(offset[,location]) 使文件位置移动offset个字节。如果没有指定location,文件位置从文件起始处移动。如是指定了location,就从指定位置移动。tell() 返回文件的当前位置trunc 阅读全文
posted @ 2013-06-08 21:24 vivianC 阅读(180) 评论(0) 推荐(0)
摘要:http://docs.python.org/2/library/json.html#module-jsonhttp://www.cnblogs.com/coser/archive/2011/12/14/2287739.htmlpython>>> help(json)import json对简单数据类型的encoding 和 decoding使用简单的json.dumps方法对简单数据类型进行编码,从python原始类型向json类型的转化对encodedjson进行decode,得到原始数据,需要使用的json.loads()函数 1 #!/usr/bin/python 2 阅读全文
posted @ 2013-06-07 15:39 vivianC 阅读(330) 评论(0) 推荐(0)
摘要:http://blog.csdn.net/menglei8625/article/details/7494509http://www.python.org/doc/current/library/xml.etree.elementtree.htmlhttp://effbot.org/zone/element-index.htmhttp://www.cnblogs.com/wangshide/articles/2224995.html1.引入库需要用到3个类,ElementTree,Element以及建立子类的包装类SubElementfrom xml.etree.ElementTree imp 阅读全文
posted @ 2013-06-07 14:50 vivianC 阅读(964) 评论(0) 推荐(1)
摘要:http://www.cnblogs.com/huxi/archive/2010/12/05/1897271.html1. 字符编码简介1.1. ASCIIASCII(American Standard Code for Information Interchange),是一种单字节的编码。计算机世界里一开始只有英文,而单字节可以表示256个不同的字符,可以表示所有的英文字符和许多的控制符号。不过ASCII只用到了其中的一半(\x80以下),这也是MBCS得以实现的基础。1.2. MBCS然而计算机世界里很快就有了其他语言,单字节的ASCII已无法满足需求。后来每个语言就制定了一套自己的编码, 阅读全文
posted @ 2013-06-06 16:35 vivianC 阅读(205) 评论(0) 推荐(0)
摘要:s为字符串s.isalnum() 所有字符都是数字或者字母s.isalpha() 所有字符都是字母s.isdigit() 所有字符都是数字s.islower() 所有字符都是小写s.isupper() 所有字符都是大写s.istitle() 所有单词都是首字母大写,像标题s.isspace() 所有字符都是空白字符、\t、\n、\r判断是整数还是浮点数a=123b=123.123>>>isinstance(a,int)True>>>isinstance(b,float)True>>>isinstance(b,int)Falsehttp:// 阅读全文
posted @ 2013-06-01 11:12 vivianC 阅读(228) 评论(0) 推荐(0)
摘要:python datetime模块strptime/strptime format常见格式命令%a 星期几的简写;如 星期三为Web %A 星期几的全称;如 星期三为Wednesday %b 月分的简写; 如4月份为Apr %B 月份的全称; 如4月份为April %c 标准的日期的时间串;(如: 04/07/10 10:43:39) %C 年份的后两位数字 %d 十进制表示的每月的第几天 %D 月/天/年 %e 在两字符域中,十进制表示的每月的第几天 %F 年-月-日 %g 年份的后两位数字,使用基于周的年 %G 年分,使用基于周的年 %h 简写的月份名 %H 24小时制... 阅读全文
posted @ 2013-06-01 10:43 vivianC 阅读(292) 评论(0) 推荐(0)
摘要:http://www.crummy.com/software/BeautifulSoup/bs3/documentation.zh.htmlBeautifulSoup的版本BeautifulSoup主要有两个版本:BeautifulSoup 3之前的,比较早的,是3.x的版本。BeautifulSoup 3的在线文档最新的,可用的,在线文档是:http://www.crummy.com/software/BeautifulSoup/bs3/documentation.html中文版的是:http://www.crummy.com/software/BeautifulSoup/bs3/docum 阅读全文
posted @ 2013-05-23 19:58 vivianC 阅读(215) 评论(0) 推荐(0)
摘要:转http://sls.weco.net/blog/xenosaga/26-12%E6%9C%88-2010/15623取得html檔在python可以很輕易的用urllib來達成webfile = urllib.urlopen(url)讀取內容可以用webcontext = wefbfile.read()orwebcontext = webfile.read().decode("UTF-8")如果不指定decode方式則以系統預設方式decode交由BeautifulSoup處理soup = BeautifulSoup.BeautifulStoneSoup(webcont 阅读全文
posted @ 2013-05-23 19:56 vivianC 阅读(247) 评论(0) 推荐(0)
摘要:在装psycopg2的时候碰到的奇怪问题。error: Setup script exited with error: Unable to find vcvarsall.bat在办公室及其上通过easy_install psycopg2安装psycopg2一切正常,但在家里的机器上按照同样的方法安装却出错,报找不到vcvarsall.bat,真是奇怪。比较了一下,两台机器的唯一区别是办公室机器上装了Visual studio 2008,难道这个有关系?如非特别需要,绝对不会安装Visual studio,microsoft的东西做的是越来越大,越来越臃肿了。总不能为了这么一个小问题就安装庞大的 阅读全文
posted @ 2013-05-23 19:27 vivianC 阅读(500) 评论(0) 推荐(0)
摘要:http://www.rafekettler.com/magicmethods.htmlA Guide to Python's Magic Methods主要包括一些 attributeaccess,reflection, context manager,pickling等http://www.cnblogs.com/Jerryshome/archive/2012/03/26/2417624.html 阅读全文
posted @ 2013-05-23 19:17 vivianC 阅读(194) 评论(0) 推荐(0)
摘要:1. install python 2.X, eg 2.72. edit environment variable , add python path into PATH (better as adminstrator)3. runez_setup.py (because it is windows system)4. just typeeasy_install in cmd windows5. add easy_installpath into PATH6. restart computerhttp://peak.telecommunity.com/DevCenter/EasyInstall 阅读全文
posted @ 2013-05-23 19:02 vivianC 阅读(250) 评论(0) 推荐(0)
摘要:转自:http://andylin02.iteye.com/blog/908170HTMLParser是Python自带的模块,使用简单,能够很容易的实现HTML文件的分析。本文主要简单讲一下HTMLParser的用法.使用时需要定义一个从类HTMLParser继承的类,重定义函数:handle_starttag( tag, attrs)handle_startendtag( tag, attrs)handle_endtag( tag)来实现自己需要的功能。tag是的html标签,attrs是 (属性,值)元组(tuple)的列表(list).HTMLParser自动将tag和attrs都转为 阅读全文
posted @ 2013-05-23 16:58 vivianC 阅读(250) 评论(0) 推荐(0)
摘要:转 http://padden.blog.51cto.com/2514314/464141介绍python的Xpath的python开元项目:1.libxml2-python-2.6.4.tar.gz安装:下载对应python版本的软件包à解压àpython setup.py install例一:import libxml2def text() :doc = libxml2.parseFile('/tmp/books.xml')for book in doc.xpathEval('/bookstore/book') : print book. 阅读全文
posted @ 2013-05-23 14:41 vivianC 阅读(802) 评论(0) 推荐(0)
摘要:python 各种解析xml包使用方法总结转http://outofmemory.cn/code-snippet/914/python-kinds-jiexi-xml-bao-usage-method-summary使用python开发时,由于python的开源生态圈非常的给力,对于实现同一个功能,往往在这方面的类库非常多,而开发者也同样面临着如何选择最佳的 类库作为辅助开发的工具。本文将记录本人在使用python处理xml格式数据时测试过的类库,有些类库由于先天不足,无法支持一些特性,涉及的类库或模 块有xml(python自带)、libxml2 、lxml 、xpath 。附注:本文处理x 阅读全文
posted @ 2013-05-23 14:34 vivianC 阅读(1168) 评论(0) 推荐(0)
摘要:转http://www.crifan.com/python_third_party_lib_html_parser_beautifulsoup/背景在Python去写爬虫,网页解析等过程中,比如:如何用Python,C#等语言去实现抓取静态网页+抓取动态网页+模拟登陆网站常常需要涉及到HTML等网页的解析。当然,对于简单的HTML中内容的提取,Python内置的正则表达式Re模块,就足够用了,但是对于复杂的HTML的处理,尤其是一些非法的,有bug的html代码的处理,那么最好还是用专门的HTML的解析的库。Python中的,专门用于HTML解析的库,比较好用的,就是BeautifulSoup 阅读全文
posted @ 2013-05-23 14:21 vivianC 阅读(1724) 评论(0) 推荐(1)