摘要:s='开始1~3& lt;?xml:namespaceprefix=ons="urn:schemas-microsoft-com:office:office"/>'importred=re.sub(']+>','',s)利用正则式处理,不知道会不会有性能问题,没有经过太多测试。目前我有很多还是使用B...
阅读全文
随笔分类 - python
摘要:Python经典教程《Python简明教程》目录:为什么Python安装Python体验PythonPython数据类型运算符与表达式控制流函数模块数据结构解决问题面向对象输入输出异常标准库更多的内容
阅读全文
摘要:python核心编程--笔记的解释器options:1.1 –d 提供调试输出1.2 –O 生成优化的字节码(生成.pyo文件)1.3 –S 不导入site模块以在启动时查找python路径1.4 –v 冗余输出(导入语句详细追踪)1.5 –m mod 将一个模块以脚本形式运行1.6 –Q opt ...
阅读全文
摘要:一、httplib实现了HTTP和HTTPS的客户端协议,一般不直接使用,在python更高层的封装模块中(urllib,urllib2)使用了它的http实现。 importhttplibconn=httplib.HTTPConnection("google.com")conn.request...
阅读全文
摘要:一个中文utf8编码后是占3个字符,所以求长度的函数可以这样写 def str_len(str): try: row_l=len(str) utf8_l=len(str.encode('utf...
阅读全文
摘要:摘要:是否想在Python解释器的内部晃悠一圈?是不是想实现一个Python代码执行的追踪器?没有基础?不要怕,这篇文章让你初窥Python底层的奥妙。 【编者按】下面博文将带你创建一个字节码级别的追踪API以追踪Python的一些内部机制,比如类似 YIELDVALUE、YIELDFROM操作码的...
阅读全文
摘要:虽然很不愿意在windows上折腾python,但有时linux不在身边的时候还得在windows上写代码。很久之前找到这个地址,后来忘了,今天搜了半天才把它找到,所以记录一下。http://www.lfd.uci.edu/~gohlke/pythonlibs/以上页面提供各种编译好的各种版本的库下...
阅读全文
摘要:1.安装(1)使用下面命令获得最新版本的ssh4py安装包 git clone git://github.com/wallunit/ssh4py (2)解压ssh4py后使用下面命令进行安装:cd ssh4py python setup.py build python setup.py instal...
阅读全文
摘要:提取Item选择器介绍 我们有很多方法从网站中提取数据。Scrapy 使用一种叫做 XPath selectors的机制,它基于 XPath表达式。如果你想了解更多selectors和其他机制你可以查阅资料http://doc.scrapy.org/topics /selectors.html#to...
阅读全文
摘要:Splinter可以非常棒的模拟浏览器的行为,Splinter提供了丰富的API,可以获取页面的信息判断当前的行为所产生的结果最近在研究网站自动登录的问题,涉及到需要实现浏览器自动化操作,网上有不少介绍,例如使用pamie,但是只是支持IE,而且项目也较久没有更新了。还 有就是利用selenium,...
阅读全文
摘要:python图片文本识别使用的工具是PIL和pytesser。因为他们使用到很多的python库文件,为了避免一个个工具的安装,建议使用pythonxy,这个工具的介绍可参考baidu。pytesser是谷歌OCR开源项目的一个模块,在Python中导入这个模块即可将图片中的文字转换成文本。pyte...
阅读全文
摘要:关于利用python进行验证码识别的一些想法 用python加“验证码”为关键词在baidu里搜一下,可以找到很多关于验证码识别的文章。我大体看了一下,主要方法有几类:一类是通过对图片进行处 理,然后利用字库特征匹配的方法,一类是图片处理后建立字符对应字典,还有一类是直接利用ocr模块进行识别。不管...
阅读全文
摘要:Python 之 使用 PIL 库做图像处理1. 简介。 图像处理是一门应用非常广的技术,而拥有非常丰富第三方扩展库的 Python 当然不会错过这一门盛宴。PIL (Python Imaging Library)是 Python 中最常用的图像处理库,目前版本为 1.1.7,我们可以在这里下载学...
阅读全文
摘要:extremetable导出excel,弹出一个下载窗口,这时不点下载而点取消,则报下面的异常:ClientAbortException Caused by: java.net.SocketException: Connection reset by peer: socket write error...
阅读全文
摘要:Python快速教程怎么能快速地掌握Python?这是和朋友闲聊时谈起的问题。Python包含的内容很多,加上各种标准库、拓展库,乱花渐欲迷人眼。我一直希望写一个快速的、容易上手的Python教程,而且言语简洁,循序渐进,让没有背景的读者也可以从基础开始学习。我将在每一篇中专注于一个小的概念,希望在...
阅读全文
摘要:http://www.sufeinet.com/thread-10200-1-1.html
阅读全文
摘要:Robert Love, Google Software Engineer and Manager on Web Search.Upvoted by Kah Seng Tay, I was the Head TA for a class taught in Java at MIT. I used…R...
阅读全文
摘要:Python:渗透测试开源项目【源码值得精读】sql注入工具:sqlmapDNS安全监测:DNSRecon暴力破解测试工具:patatorXSS漏洞利用工具:XSSerWeb服务器压力测试工具:HULKSSL安全扫描器:SSLyze网络Scapy: send, sniff and dissect a...
阅读全文
摘要:创建成功的Python项目前端开发工具技巧介绍—Sublime篇SEO在网页制作中的应用观察者模式使用D3制作图表英文原文:Create successful Python projects,编译:Elaine.Ye创建一个成功的开源Python项目所涉及的并不仅仅是编写有用的代码,与其相关的还有社...
阅读全文
摘要:含有换行符的正则表达式如何匹配:\s\S\S是各种空白字符,比如\n\t之类的,而\s是^\S点号( . )可以匹配换行符之外的任何单个字符,被称之为通配符。匹配包含\n在內的任何字符用 (.|\n)。importre strvar="""helloworld!"""patt=r'(.|\n)*'r...
阅读全文
浙公网安备 33010602011771号