Python - 随笔分类 - vivianC

python re 正则表达式[转]

摘要：01.#!/usr/bin/env python 02.# -*- coding: utf-8 -*- 03.import re 04. 05.def regex(): 06. str = 'abcdab' 07. patstr = 'ab' 08. ... 阅读全文

posted @ 2014-04-11 18:38 vivianC 阅读(337) 评论(0) 推荐(0)

Python的map、filter、reduce函数 [转]

摘要：1. map函数func作用于给定序列的每个元素，并用一个列表来提供返回值。 map函数python实现代码：def map(func,seq): mapped_seq = [] for eachItem in seq: mapped_seq.append(func(eachItem)) return mapped_seq #-*-coding:utf-8-*-def add(x,y): return x+yprint map(add, range(8),range(8))2. filter函数的功能相当于过滤器。调用一个布尔函数bool_func来迭代遍历每个... 阅读全文

posted @ 2014-04-11 09:47 vivianC 阅读(231) 评论(0) 推荐(0)

python os.path模块

摘要：os.path.abspath(path) #返回绝对路径os.path.basename(path) #返回文件名os.path.commonprefix(list) #返回list(多个路径)中，所有path共有的最长的路径。os.path.dirname(path) #返回文件路径os.path.exists(path) #路径存在则返回True,路径损坏返回Falseos.path.lexists #路径存在则返回True,路径损坏也返回Trueos.path.expanduser(path) #把path中包含的"~"和"~user"转换成用户阅读全文

posted @ 2014-01-09 09:32 vivianC 阅读(224) 评论(0) 推荐(0)

python 中的列表解析和生成表达式 - 转

摘要：优雅、清晰和务实都是python的核心价值观，如果想通过操作和处理一个序列（或其他的可迭代对象）来创建一个新的列表时可以使用列表解析（ List comprehensions）和生成表达式，通过这两个操作，我们可以看到这三个观点是如何在python中和谐统一起来的。列表解析在需要改变列表而不是需要新建某列表时，可以使用列表解析。列表解析表达式为： [expr for iter_var in iterable] [expr for iter_var in iterable if cond_expr] 第一种语法：首先迭代iterable里所有内容，每一次迭代，都把iterable里相应内容放到. 阅读全文

posted @ 2013-12-09 10:54 vivianC 阅读(621) 评论(0) 推荐(0)

Python读写文件 - 转

摘要：http://blog.csdn.net/adupt/article/details/4435615http://docs.python.org/release/2.5.2/lib/bltin-file-objects.htmlhttp://blog.csdn.net/firlc/article/details/69568041.open使用open打开文件后一定要记得调用文件对象的close()方法。比如可以用try/finally语句来确保最后能关闭文件。file_object=open('thefile.txt')try: all_the_text=file_object 阅读全文

posted @ 2013-12-03 15:38 vivianC 阅读(233) 评论(0) 推荐(0)

python文件读写 - 转

摘要：shelve,cPickle模块close() 关闭文件对象flush() 刷新文件的缓冲区。缓冲区包含等待写入或文件中读取的信息。“刷新“就是执行实际的读取或写入操作isatty() 如果文件对象是tty(终端）设备，就返回1read([size]) 从文件中读取数据。readline([size]) 从文件中读取一行readlines([size]) 从文件中读取多行seek(offset[,location]) 使文件位置移动offset个字节。如果没有指定location,文件位置从文件起始处移动。如是指定了location,就从指定位置移动。tell() 返回文件的当前位置trunc 阅读全文

posted @ 2013-06-08 21:24 vivianC 阅读(180) 评论(0) 推荐(0)

python Json

摘要：http://docs.python.org/2/library/json.html#module-jsonhttp://www.cnblogs.com/coser/archive/2011/12/14/2287739.htmlpython>>> help(json)import json对简单数据类型的encoding 和 decoding使用简单的json.dumps方法对简单数据类型进行编码，从python原始类型向json类型的转化对encodedjson进行decode，得到原始数据，需要使用的json.loads()函数 1 #!/usr/bin/python 2 阅读全文

posted @ 2013-06-07 15:39 vivianC 阅读(332) 评论(0) 推荐(0)

python:ElementTree操作XML

摘要：http://blog.csdn.net/menglei8625/article/details/7494509http://www.python.org/doc/current/library/xml.etree.elementtree.htmlhttp://effbot.org/zone/element-index.htmhttp://www.cnblogs.com/wangshide/articles/2224995.html1.引入库需要用到3个类，ElementTree，Element以及建立子类的包装类SubElementfrom xml.etree.ElementTree imp 阅读全文

posted @ 2013-06-07 14:50 vivianC 阅读(967) 评论(0) 推荐(1)

Python字符编码详解 - 转

摘要：http://www.cnblogs.com/huxi/archive/2010/12/05/1897271.html1. 字符编码简介1.1. ASCIIASCII(American Standard Code for Information Interchange)，是一种单字节的编码。计算机世界里一开始只有英文，而单字节可以表示256个不同的字符，可以表示所有的英文字符和许多的控制符号。不过ASCII只用到了其中的一半（\x80以下），这也是MBCS得以实现的基础。1.2. MBCS然而计算机世界里很快就有了其他语言，单字节的ASCII已无法满足需求。后来每个语言就制定了一套自己的编码，阅读全文

posted @ 2013-06-06 16:35 vivianC 阅读(208) 评论(0) 推荐(0)

python判断字符串 - 转

摘要：s为字符串s.isalnum() 所有字符都是数字或者字母s.isalpha() 所有字符都是字母s.isdigit() 所有字符都是数字s.islower() 所有字符都是小写s.isupper() 所有字符都是大写s.istitle() 所有单词都是首字母大写，像标题s.isspace() 所有字符都是空白字符、\t、\n、\r判断是整数还是浮点数a=123b=123.123>>>isinstance(a,int)True>>>isinstance(b,float)True>>>isinstance(b,int)Falsehttp:// 阅读全文

posted @ 2013-06-01 11:12 vivianC 阅读(229) 评论(0) 推荐(0)

python time

摘要：python datetime模块strptime/strptime format常见格式命令%a 星期几的简写;如星期三为Web %A 星期几的全称;如星期三为Wednesday %b 月分的简写; 如4月份为Apr %B 月份的全称; 如4月份为April %c 标准的日期的时间串;（如： 04/07/10 10:43:39） %C 年份的后两位数字 %d 十进制表示的每月的第几天 %D 月/天/年 %e 在两字符域中，十进制表示的每月的第几天 %F 年-月-日 %g 年份的后两位数字，使用基于周的年 %G 年分，使用基于周的年 %h 简写的月份名 %H 24小时制... 阅读全文

posted @ 2013-06-01 10:43 vivianC 阅读(294) 评论(0) 推荐(0)

BeautifulSoup 3的在线文档

摘要：http://www.crummy.com/software/BeautifulSoup/bs3/documentation.zh.htmlBeautifulSoup的版本BeautifulSoup主要有两个版本：BeautifulSoup 3之前的，比较早的，是3.x的版本。BeautifulSoup 3的在线文档最新的，可用的，在线文档是：http://www.crummy.com/software/BeautifulSoup/bs3/documentation.html中文版的是：http://www.crummy.com/software/BeautifulSoup/bs3/docum 阅读全文

posted @ 2013-05-23 19:58 vivianC 阅读(215) 评论(0) 推荐(0)

[python] beautifulsoup介紹 - 转

摘要：转http://sls.weco.net/blog/xenosaga/26-12%E6%9C%88-2010/15623取得html檔在python可以很輕易的用urllib來達成webfile = urllib.urlopen(url)讀取內容可以用webcontext = wefbfile.read()orwebcontext = webfile.read().decode("UTF-8")如果不指定decode方式則以系統預設方式decode交由BeautifulSoup處理soup = BeautifulSoup.BeautifulStoneSoup(webcont 阅读全文

posted @ 2013-05-23 19:56 vivianC 阅读(249) 评论(0) 推荐(0)

error: Setup script exited with error: Unable to find vcvarsall.bat - 转

摘要：在装psycopg2的时候碰到的奇怪问题。error: Setup script exited with error: Unable to find vcvarsall.bat在办公室及其上通过easy_install psycopg2安装psycopg2一切正常，但在家里的机器上按照同样的方法安装却出错，报找不到vcvarsall.bat，真是奇怪。比较了一下，两台机器的唯一区别是办公室机器上装了Visual studio 2008，难道这个有关系？如非特别需要，绝对不会安装Visual studio，microsoft的东西做的是越来越大，越来越臃肿了。总不能为了这么一个小问题就安装庞大的阅读全文

posted @ 2013-05-23 19:27 vivianC 阅读(504) 评论(0) 推荐(0)

A Guide to Python's Magic Methods 【转载】

摘要：http://www.rafekettler.com/magicmethods.htmlA Guide to Python's Magic Methods主要包括一些 attributeaccess，reflection， context manager，pickling等http://www.cnblogs.com/Jerryshome/archive/2012/03/26/2417624.html 阅读全文

posted @ 2013-05-23 19:17 vivianC 阅读(196) 评论(0) 推荐(0)

window install python easy_install

摘要：1. install python 2.X, eg 2.72. edit environment variable , add python path into PATH (better as adminstrator)3. runez_setup.py (because it is windows system)4. just typeeasy_install in cmd windows5. add easy_installpath into PATH6. restart computerhttp://peak.telecommunity.com/DevCenter/EasyInstall 阅读全文

posted @ 2013-05-23 19:02 vivianC 阅读(250) 评论(0) 推荐(0)

Python 用HTMLParser解析HTML文件 - 转

摘要：转自：http://andylin02.iteye.com/blog/908170HTMLParser是Python自带的模块，使用简单，能够很容易的实现HTML文件的分析。本文主要简单讲一下HTMLParser的用法.使用时需要定义一个从类HTMLParser继承的类，重定义函数：handle_starttag( tag, attrs)handle_startendtag( tag, attrs)handle_endtag( tag)来实现自己需要的功能。tag是的html标签，attrs是 (属性，值)元组(tuple)的列表(list).HTMLParser自动将tag和attrs都转为阅读全文

posted @ 2013-05-23 16:58 vivianC 阅读(251) 评论(0) 推荐(0)

python对xpath的支持 - 转

摘要：转 http://padden.blog.51cto.com/2514314/464141介绍python的Xpath的python开元项目:1.libxml2-python-2.6.4.tar.gz安装：下载对应python版本的软件包à解压àpython setup.py install例一：import libxml2def text() :doc = libxml2.parseFile('/tmp/books.xml')for book in doc.xpathEval('/bookstore/book') : print book. 阅读全文

posted @ 2013-05-23 14:41 vivianC 阅读(804) 评论(0) 推荐(0)

python 各种解析xml包使用方法总结 - 转

摘要：python 各种解析xml包使用方法总结转http://outofmemory.cn/code-snippet/914/python-kinds-jiexi-xml-bao-usage-method-summary使用python开发时，由于python的开源生态圈非常的给力，对于实现同一个功能，往往在这方面的类库非常多，而开发者也同样面临着如何选择最佳的类库作为辅助开发的工具。本文将记录本人在使用python处理xml格式数据时测试过的类库，有些类库由于先天不足，无法支持一些特性，涉及的类库或模块有xml(python自带)、libxml2 、lxml 、xpath 。附注：本文处理x 阅读全文

posted @ 2013-05-23 14:34 vivianC 阅读(1172) 评论(0) 推荐(0)

BeautifulSoup - Python中第三方的用于解析HTML的库：BeautifulSoup - 转

摘要：转http://www.crifan.com/python_third_party_lib_html_parser_beautifulsoup/背景在Python去写爬虫，网页解析等过程中，比如：如何用Python，C#等语言去实现抓取静态网页+抓取动态网页+模拟登陆网站常常需要涉及到HTML等网页的解析。当然，对于简单的HTML中内容的提取，Python内置的正则表达式Re模块，就足够用了，但是对于复杂的HTML的处理，尤其是一些非法的，有bug的html代码的处理，那么最好还是用专门的HTML的解析的库。Python中的，专门用于HTML解析的库，比较好用的，就是BeautifulSoup 阅读全文

posted @ 2013-05-23 14:21 vivianC 阅读(1725) 评论(0) 推荐(1)

vivianC

随笔分类 - Python

公告