随笔分类 -  python语言

摘要:python语言的易用性不言而喻,使用python访问数据库也及其方便。简单给出一个示例程序。在使用connect函数连接数据库时,需要给出数据库的相关连接方式,比如地址(host),端口(port),用户名(user)、密码(passwd),以及数据库的名称(db)。# -*- coding: utf-8 -*-import sysimport MySQLdbreload(sys)sys.setdefaultencoding('utf-8')def access_db(): conn = MySQLdb.connect(host='',port=,user=& 阅读全文
posted @ 2013-06-06 00:21 java程序员填空 阅读(183) 评论(0) 推荐(0)
摘要:zip函数接受任意多个序列作为参数,将所有序列按相同的索引组合成一个元素是各个序列合并成的tuple的新序列,新的序列的长度以参数中最短的序列为准。另外(*)操作符与zip函数配合可以实现与zip相反的功能,即将合并的序列拆成多个tuple。①tuple的新序列>>>>x=[1,2,3],y=['a','b','c']>>>zip(x,y)[(1,'a'),(2,'b'),(3,'c')]②新的序列的长度以参数中最短的序列为准.>>>> 阅读全文
posted @ 2013-06-05 19:12 java程序员填空 阅读(198) 评论(0) 推荐(0)
摘要:获取时间相关的信息,需要用到time模块的东西。import timeprint time.time()结果为:1368369990.86这是当前的时间戳,表示从1970年到现在的时间间隔。可通过如下函数对当前时间进行格式化:print time.localtime(time.time())结果为:time.struct_time(tm_year=2013, tm_mon=5, tm_mday=12, tm_hour=22, tm_min=48, tm_sec=5, tm_wday=6, tm_yday=132, tm_isdst=0)还可以使用time.strftime()方法,将时间戳格式 阅读全文
posted @ 2013-05-12 22:47 java程序员填空 阅读(153) 评论(0) 推荐(0)
摘要:在程序中中导入 Beautiful Soup库:from BeautifulSoup import BeautifulSoup # For processing HTMLfrom BeautifulSoup import BeautifulStoneSoup # For processing XMLimport BeautifulSoup # To get everythingsoup = BeautifulSoup(html, from_encoding='utf-8')smartQuotesTo=None 到soup构造器:这时 smart quot... 阅读全文
posted @ 2013-05-08 16:57 java程序员填空 阅读(869) 评论(0) 推荐(0)
摘要:在python处理字符串的时候,有的时候会用到简繁体之间的转换。简繁体转换的工具很多,但是一直都没有一个完美的解决方案。在这里介绍一个比较好用的简繁体转换工具,纯python编写,并且附上示例代码:from langconv import *# 转换繁体到简体line = Converter('zh-hans').convert(line.decode('utf-8'))line = line.encode('utf-8')# 转换简体到繁体line = Converter('zh-hant').convert(line.deco 阅读全文
posted @ 2013-05-08 16:40 java程序员填空 阅读(320) 评论(0) 推荐(0)
摘要:import randomrandom.random(): 产生[0,1)之间的随机数random.uniform(a,b):产生[a,b]之间的随机数random.randint(a,b):产生[a,b]之间的整数random.randrange(start,stop[,step]):在[start,stop]范围内,按指定的基数递增,获取一个随机数。random.choice(sequence):从一个指定的序列中,随机获取一个元素。random.shuffle(x[,random]):用于将一个列表中的元素打乱,然后返回打乱的结果,原列表不变。random.sample(sequence 阅读全文
posted @ 2013-05-06 21:16 java程序员填空 阅读(168) 评论(0) 推荐(0)
摘要:在python编程的过程中,编码和解码是经常遇见的问题。常见的编码有unicode,gb2312,gbk,utf-8等等。在编码和解码的过程过,使用最频繁的函数就是decode()和encode。其中decode()函数,表示把字符串从原有编码,解码成unicode中间编码。 encode()函数,表示把字符串从unicode中间编码,转换成目标编码。举例:lines = open(input_file_name, 'r').readlines() for line in lines: line = line.strip() line = line.decode('gb 阅读全文
posted @ 2013-05-06 21:14 java程序员填空 阅读(341) 评论(0) 推荐(0)
摘要:在使用BeautifulSoup解析HTML文件的过程中,经常使用到类似如下的语句:soup = BeautifulSoup(html) for string in soup.strings: string = string.strip()注意,上述代码中,没有对string的编码进行任何的设置,所以string的默认编码为ascii。如果不注意,这种默认的编码方式,会带来很大的麻烦。即便你使用:string = string.decode('ascii').encode('utf-8')也不能转换string的编码。所以最好的方式如下所示:soup = Bea 阅读全文
posted @ 2013-05-06 21:11 java程序员填空 阅读(227) 评论(0) 推荐(0)
摘要:HTML 中的常用字符实体是不间断空格(;)。 编码为160,而普通的空格编码为32。在处理HTML文件的时候,最好直接将 直接替换为普通空格,以免在后续的处理中,带来不必要的麻烦。html = html.replace(' ', ' ') 阅读全文
posted @ 2013-05-06 21:09 java程序员填空 阅读(719) 评论(1) 推荐(0)
摘要:str():用户希望看到的形式。repr():代码中的状态。name=raw_input():把所有的输入当作原始字符串。name=input():要求输入合法的python表达式,在程序中,尽量使用raw_input()函数。字符串:长字符串:'''str''', """str"""原始字符串:r'str',不把\当作特殊字符,处理路径时尤其有用。最后一个字符不能是\。unicode字符:u'str'+(加) -(减) *(乘) /(除) //(整除) 阅读全文
posted @ 2013-01-06 15:36 java程序员填空 阅读(208) 评论(0) 推荐(0)
摘要:1. 正则表达式基础1.1. 简单介绍正则表达式并不是Python的一部分。正则表达式是用于处理字符串的强大工具,拥有自己独特的语法以及一个独立的处理引擎,效率上可能不如str自带的方法,但功能十分强大。得益于这一点,在提供了正则表达式的语言里,正则表达式的语法都是一样的,区别只在于不同的编程语言实现支持的语法数量不同;但不用担心,不被支持的语法通常是不常用的部分。如果已经在其他语言里使用过正则表达式,只需要简单看一看就可以上手了。下图展示了使用正则表达式进行匹配的流程:正则表达式的大致匹配过程是:依次拿出表达式和文本中的字符比较,如果每一个字符都能匹配,则匹配成功;一旦有匹配不成功的字符则匹 阅读全文
posted @ 2013-01-06 08:10 java程序员填空 阅读(194) 评论(0) 推荐(0)