导航

上一页 1 ··· 7 8 9 10 11

2011年6月11日

摘要: ======================================================================当Adobe、Microsoft、Sun等一系列巨头开始表现出对”开源”的青睐时,”开源”的时代即将到来!最初来自:sinoprise.com/read.php?tid-662-page-e-fpage-1.html(遗憾的是这个链接已经打不开了),我基本未改动,只是进行了一些排版和整理。参考文献:http://www.fsf.org/licensing/licenses/现今存在的开源协议很多,而经过Open Source Initiative组织通过批 阅读全文

posted @ 2011-06-11 18:39 Morya 阅读(1114) 评论(5) 推荐(1)

2011年5月12日

摘要: fromhttp://obmem.info/?p=753以前写过一篇使用python爬虫抓站的一些技巧总结,总结了诸多爬虫使用的方法;那篇东东现在看来还是挺有用的,但是当时很菜(现在也菜,但是比那时进步了不少),很多东西都不是很优,属于”只是能用”这么个层次。这篇进阶篇打算把“能用”提升到“用得省事省心”这个层次。一、gzip/deflate支持现在的网页普遍支持gzip压缩,这往往可以解决大量传输时间,以VeryCD的主页为例,未压缩版本247K,压缩了以后45K,为原来的1/5。这就意味着抓取速度会快5倍。然而python的urllib/urllib2默认都不支持压缩,要返回压缩格式,必须 阅读全文

posted @ 2011-05-12 23:16 Morya 阅读(1126) 评论(0) 推荐(0)

摘要: fromhttp://obmem.info/?p=476学用python也有3个多月了,用得最多的还是各类爬虫脚本:写过抓代理本机验证的脚本,写过在discuz论坛中自动登录自动发贴的脚本,写过自动收邮件的脚本,写过简单的验证码识别的脚本,本来想写google music的抓取脚本的,结果有了强大的gmbox,也就不用写了。-这些脚本有一个共性,都是和web相关的,总要用到获取链接的一些方法,再加上simplecd这个半爬虫半网站的项目,累积不少爬虫抓站的经验,在此总结一下,那么以后做东西也就不用重复劳动了。-1.最基本的抓站import urllib2content = urllib2.ur 阅读全文

posted @ 2011-05-12 23:15 Morya 阅读(886) 评论(0) 推荐(0)

摘要: copy from http://hi.baidu.com/chjj910/blog/item/7db5c24fbc699d19b2de0540.htmlpython基于http协议编程:httplib,urllib和urllib2(转)2010-11-11 20:47httplib实现了HTTP和HTTPS的客户端协议,一般不直接使用,在python更高层的封装模块中(urllib,urllib2)使用了它的http实现。importhttplibconn=httplib.HTTPConnection("google.com")conn.request('get& 阅读全文

posted @ 2011-05-12 23:06 Morya 阅读(13423) 评论(0) 推荐(0)

2011年5月4日

摘要: 1 #coding:utf8 2 3 import sys 4 from PySide import QtCore 5 from PySide import QtGui 6 from PySide import QtWebKit 7 from PySide import QtNetwork 8 from pprint import pprint 9 10 class Mainwin(QtGui.QMainWindow): 11 def __init__(self, parent= None): 12 super(Mainwin, self).__init__( parent) 13 14 Q. 阅读全文

posted @ 2011-05-04 07:30 Morya 阅读(1774) 评论(7) 推荐(0)

2011年3月29日

摘要: 最近因为项目需要,需要在多个古老的linux/unix版本上完成一个工具,有些没有python所在,不得不重拾perl文档……再读perl文档的,是一个让人吐血的过程。习惯了python> 2.4 的语法和core库组织,那种相对来说比较合理的安排和统一的格式,perl的就显得非常的不合理。我想这应该是因为它所出现的那个石器时代造成了这些个时代断层,最初的优雅和惊艳经过前仆后继维护者的缝缝补补,变成了现在这个百变妖精的德行……1,perl的关键字语法多变和诡异,比如unless 循环;2,各种函数和各种表达式的上下文敏感的使用方式;# 这两句就相当不同……@b = @a;$b = @a; 阅读全文

posted @ 2011-03-29 22:27 Morya 阅读(655) 评论(4) 推荐(1)

2011年3月26日

摘要: copy fromhttp://www.lwolf.cn/blog/article/program/perl-ini.html之前有写过用C#解析INI文件的文章,那时是因为要用Perl来解析INI,后来就在网上找了个现成的解析代码IniParser.假设INI文件是这样的:[Directories]Input=c:\autoexec.bat 使用方法如下:use IniParser;my $ini = IniParser->new("c:\\test.ini");my $inputdir = $ini->expectEntry("Directorie 阅读全文

posted @ 2011-03-26 20:05 Morya 阅读(754) 评论(0) 推荐(0)

摘要: fcntl FILEHANDLE,FUNCTION,SCALARImplements the fcntl(2) function. You'll probably have to say use Fcntl;first to get the correct constant definitions. Argument processing and value returned work just likeioctlbelow. For example:use Fcntl;fcntl($filehandle, F_GETFL, $packed_return_buffer) or die 阅读全文

posted @ 2011-03-26 19:50 Morya 阅读(681) 评论(1) 推荐(0)

上一页 1 ··· 7 8 9 10 11