摘要: 想用python模拟浏览器访问web的方法测试些东西,有哪几种方法呢?一类:单纯的访问web,不解析其js,css等。1. urllib2#-*- coding:utf-8 -*import urllib2def Furllib2(ip,port,url,timeout): proxydict... 阅读全文
posted @ 2014-03-03 16:08 马僧 阅读(11525) 评论(0) 推荐(0) 编辑
摘要: 转载于:http://yxmhero1989.blog.163.com/blog/static/112157956201381443244790/Python很简洁 我们喜欢简单有效的代码 一.{}.fromkeys(list).keys()list2 = {}.fromkeys(list1).keys()二.setlist2 = list(set(list1))三.itertools.groubyids = [1,4,3,3,4,2,3,4,5,6,1]ids.sort()it = itertools.groupby(ids)for k, g in it: print k四,笨方法id... 阅读全文
posted @ 2014-02-24 10:29 马僧 阅读(782) 评论(0) 推荐(0) 编辑
摘要: 1. 首先下周数据源,选择是纯真数据库:http://www.cz88.net/2. 安装后,打开软件,将数据导出为txt格式。3. 处理数据,参照网上的文章(http://www.jb51.net/article/20511.htm),用vi打开,执行如下命令::%s/\s\+/;/执行3次。%s代表全局搜索替换,\s 代表空格 , \+ 代表尽可能多的匹配前面的字符,;代表替换成';'(我再实际操作的时候将;替换为tab了)4. 创建表ip2startip varchar 255 0 -1 0 0 0 0 0 gbk gbk_chinese_ci 0 0endip varc 阅读全文
posted @ 2014-01-15 15:31 马僧 阅读(792) 评论(0) 推荐(0) 编辑
摘要: http://ylw6006.blog.51cto.com/470441/888523主数据库负责插入更新等从数据库负责查询等 阅读全文
posted @ 2013-12-31 17:05 马僧 阅读(115) 评论(0) 推荐(0) 编辑
摘要: 基本格式 : * * * * * command 分 时 日 月 周 命令 第1列表示分钟1~59 每分钟用*或者 */1表示 第2列表示小时1~23(0表示0点) 第3列表示日期1~31 第4列表示月份1~12 第5列标识号星期0~6(0表示星期天) 第6列要运行的命令 crontab文件的一些例子: 30 21 * * * /usr/local/etc/rc.d/lighttpd restart 上面的例子表示每晚的21:30重启apache。 45 4 1,10,22 * * /usr/local/etc/rc.d/lighttpd restart 上面的例子表示每月1、10、... 阅读全文
posted @ 2013-12-31 17:05 马僧 阅读(219) 评论(0) 推荐(0) 编辑
摘要: 安装:sudo apt-get install python-tornado sudo apt-get install nginx sudo apt-get install supervisor1. 配置nginx。我安装的nginx的目录为2个配置文件。/etc/nginx/nginx.conf ... 阅读全文
posted @ 2013-12-30 14:44 马僧 阅读(1262) 评论(0) 推荐(0) 编辑
摘要: def SaveAttach():# login the pop3 server ,retrive the new mails ,and download the attachments dstdir =dirname+str(time.ctime(time.time()))+'.zip' print 'starts' pp = poplib.POP3_SSL(mail_host,mail_port) print 'connect successful' pp.set_debuglevel(1) pp.user(mail_user) pp.pas 阅读全文
posted @ 2013-12-25 17:32 马僧 阅读(2835) 评论(0) 推荐(0) 编辑
摘要: def SaveAttachImap():# login the imap server ,retrive the new mails ,and download the attachments. M = imaplib.IMAP4(mail_host,mail_port) #print M M.login(mail_user,mail_pass) M.select('INBOX',False) #result, message = M.select('INBOX',False) typ, data = M.search(None, 'UNSEEN 阅读全文
posted @ 2013-12-25 17:31 马僧 阅读(2189) 评论(0) 推荐(0) 编辑
摘要: def send_mail(to_list, sub, context):#sentmail to the maillist ''' to_list: 发送给谁 sub: 主题 context: 内容 send_mail("xxx@126.com","sub","context") ''' #print 'test begins' mail_host = "smtp.163.com" mail_user = "admin" mail 阅读全文
posted @ 2013-12-25 17:29 马僧 阅读(914) 评论(0) 推荐(0) 编辑
摘要: 参考:http://www.cnblogs.com/dkblog/archive/2011/08/26/2155018.html通过logging.config模块配置日志#logger.conf###############################################[loggers] #有哪些日志记录器,这里有个root,还有2个example01,exampl02keys=root,example01,example02[logger_root]level=DEBUGhandlers=hand01,hand02[logge... 阅读全文
posted @ 2013-12-25 17:23 马僧 阅读(444) 评论(0) 推荐(0) 编辑
摘要: >>> urllib.unquote('%E4%B8%BD%E6%B1%9F')>>> data'\xe4\xb8\xbd\xe6\xb1\x9f'>>>urllib.quote(data) 阅读全文
posted @ 2013-12-24 13:32 马僧 阅读(454) 评论(0) 推荐(0) 编辑
摘要: 1. 需要输出3列,为了输出好看,需要制定每一列的宽度:‘%6.2f’ % 1.235# 长度为6,保留2为小数print '{0:20} {1:右对齐^中间对齐=(只用于数字)在小数点后进行补齐2. 表格式描述%%百分号标记%c字符及其ASCII码%s字符串%d有符号整数(十进制)%u无符号整数(十进制)%o无符号整数(八进制)%x无符号整数(十六进制)%X无符号整数(十六进制大写字符)%e浮点数字(科学计数法)%E浮点数字(科学计数法,用E代替e)%f浮点数字(用小数点符号)%g浮点数字(根据值的大小采用%e或%f)%G浮点数字(类似于%g)%p指针(用十六进制打印值的内存地址.. 阅读全文
posted @ 2013-11-13 18:26 马僧 阅读(551) 评论(0) 推荐(0) 编辑
摘要: 为了从更快的的使用这个模块,我们会省略一些东西,开始吧。1. 加载模块from optparse import OptionParser2. 实例化OptionParse,可以理解为表明useage和version:如parser = OptionParser(usage="usage: %prog [options] ", version="%prog 1.0")3. 添加参数,如-c,--csv啥的,也就是你想要添加的功能参数。你可以添加很多,随你的需要parser.add_option("-c", "--csv&quo 阅读全文
posted @ 2013-10-28 10:05 马僧 阅读(250) 评论(0) 推荐(0) 编辑
摘要: 为了从更快的的使用这个模块,我们会省略一些东西,开始吧。1. 加载模块from optparse import OptionParser2. 实例化OptionParse,可以理解为表明useage和version:如parser = OptionParser(usage="usage: %prog [options] ", version="%prog 1.0")3. 添加参数,如-c,--csv啥的,也就是你想要添加的功能参数。你可以添加很多,随你的需要parser.add_option("-c", "--csv&quo 阅读全文
posted @ 2013-10-25 15:54 马僧 阅读(455) 评论(0) 推荐(0) 编辑
摘要: python的有关时间的有哪几种呢?今天我们介绍两个:time和datetimetime模块提供各种操作时间的函数datetime模块定义了下面这几个类:datetime.date:表示日期的类。常用的属性有year, month, day;datetime.time:表示时间的类。常用的属性有hour, minute, second, microsecond;datetime.datetime:表示日期时间。datetime.timedelta:表示时间间隔,即两个时间点之间的长度。datetime.tzinfo:与时区有关的相关信息。python中处理的事件类型有哪几种呢?* 时间戳的方式 阅读全文
posted @ 2013-10-25 14:26 马僧 阅读(30664) 评论(0) 推荐(1) 编辑
摘要: stat 系统调用时用来返回相关文件的系统状态信息的。首先我们看一下stat中有哪些属性:>>> import os>>> print os.stat("/root/python/zip.py")(33188, 2033080, 26626L, 1, 0, 0, 864, 1297653596, 1275528102, 1292892895)>>> print os.stat("/root/python/zip.py").st_mode #权限模式33188>>> print os. 阅读全文
posted @ 2013-10-24 15:12 马僧 阅读(43003) 评论(0) 推荐(0) 编辑
摘要: int(x [,base ]) 将x转换为一个整数 long(x [,base ]) 将x转换为一个长整数 float(x ) 将x转换到一个浮点数 complex(real [,imag ]) 创建一个复数 str(x ) 将对象 x 转换为字符串 repr(x ) 将对象 x 转换为表达式字符串 eval(str ) 用来计算在字符串中的有效Python表达式,并返回一个对象 tuple(s ) 将序列 s 转换为一个元组 list(s ) 将序列 s 转换为一个列表 chr(x ) 将一个整数转换为一个字符 unichr(x ) 将一个整数转换为Unicode字符 ord(x ) 将一个 阅读全文
posted @ 2013-10-24 14:06 马僧 阅读(1254) 评论(0) 推荐(0) 编辑
摘要: >>> a = '中文'>>> chardet.detect(a){'confidence': 0.7525, 'encoding': 'utf-8'}>>> b = a.decode('utf-8')>>> bu'\u4e2d\u6587'>>> c = b.encode('gb2312')>>> c'\xd6\xd0\xce\xc4'>>> 阅读全文
posted @ 2013-08-29 17:28 马僧 阅读(254) 评论(0) 推荐(0) 编辑
摘要: 1. 安装:sudo apt-get install vsftpd2. 我的目的是建立个ftp,专门的账户访问,账户不可以登陆。不允许匿名登陆3. 更改配置文件/etc/vsftpd.conflisten=YESanonymous_enable=nolocal_enable=YESwrite_enable=YESlocal_umask=022dirmessage_enable=YESuse_localtime=YESxferlog_enable=YESconnect_from_port_20=YESxferlog_file=/var/log/vsftpd.logidle_session_tim 阅读全文
posted @ 2013-08-22 13:23 马僧 阅读(306) 评论(0) 推荐(0) 编辑
摘要: 工作中有时候会有这种需求:1. 自动配置组策略的安全基线,这个东西不用你自己写了,微软有这个工具,Microsoft Security Compliance Manager,你可以在下面的地址去下载和学习使用。 technet.microsoft.com/library/cc677002.aspx2. 但是有时候你可能需要自动化的获取服务器上的某些信息,如cpu啊,disk等,以及组策略中的相关设定,这个应该怎么去获取呢,是不是可以完全去访问注册表的值呢,但是貌似有些审核策略是没有注册表值的。这里推荐一种方法,当然如果你有更好的方法,欢迎分享: 你可以使用这个命令来将策略值导出,然后利用程序. 阅读全文
posted @ 2013-08-07 09:36 马僧 阅读(1815) 评论(0) 推荐(0) 编辑
摘要: 有时候需要将命令行或者网页上的或者文件中的内容读取出来做些处理,这个时候可能你发现读取出来的内容是其他的编码方式,如\x20等。处理思路如下:下载chardet模块,安装。利用chardet模块检测读取出来的str是什么编码格式的,如‘UTF-8'或者’GB2312‘等。>>> import chardet>>> chardet.detect(a){'confidence': 0.0, 'encoding': None}知道了编码方式后就可以针对他进行解码了,如:>>> a.decode('G 阅读全文
posted @ 2013-08-06 17:16 马僧 阅读(371) 评论(0) 推荐(0) 编辑
摘要: python 下划线 阅读全文
posted @ 2013-07-25 13:21 马僧 阅读(250) 评论(0) 推荐(0) 编辑
摘要: 利用python写程序从mysql中读取数据写入excel中,结果发现中文显示乱码。网上搜索了下方法: Python文件设置编码 utf-8 (文件前面加上 #encoding=utf-8), 同时文件保存的格式也应该是utf8 MySQL数据库charset=utf-8 ,数据库的编码必须是utf8 python连接MySQL时加上编码参数 conn = MySQLdb.Connection(host='localhost', user='root', passwd='123', db='test',charset='u 阅读全文
posted @ 2013-03-12 13:48 马僧 阅读(11098) 评论(0) 推荐(0) 编辑
摘要: html5 概览 阅读全文
posted @ 2013-03-07 17:20 马僧 阅读(236) 评论(0) 推荐(0) 编辑