摘要:
intitle:在title中搜索inurl:在url中搜索filetype:doc 电子商务link:www.boy38girl.cn查找该站的反向链接来自 王通 《搜索引擎排名秘笈》 阅读全文
posted @ 2010-08-06 20:44
lexus
阅读(162)
评论(0)
推荐(0)
摘要:
intitle:在title中搜索inurl:在url中搜索filetype:doc 电子商务link:www.boy38girl.cn查找该站的反向链接来自 王通 《搜索引擎排名秘笈》 阅读全文
posted @ 2010-08-06 20:44
lexus
阅读(162)
评论(0)
推荐(0)
摘要:
http://feitianhanxue.blog.chinabyte.com/2010/08/03/384/ 阅读全文
posted @ 2010-08-04 23:52
lexus
阅读(195)
评论(0)
推荐(0)
摘要:
wget -m -R gif,png,jpg,css,js http://www.360kxr.comhttp://tc.wangchao.net.cn/bbs/detail_1415658.html 阅读全文
posted @ 2010-08-04 17:29
lexus
阅读(224)
评论(0)
推荐(0)
摘要:
因为发烫太厉害了,虽然是全铝的,还是很热,看是不是电池一直充放电的缘故 阅读全文
posted @ 2010-08-04 17:13
lexus
阅读(226)
评论(0)
推荐(0)
摘要:
python piysho;loyy:qickly and no dirtyruby:coding for funphp:quickly and dirtyms傻子能编程朋友和我说的 阅读全文
posted @ 2010-08-03 18:47
lexus
阅读(298)
评论(0)
推荐(0)
摘要:
始终使当前页面,尽可能的在中间#!/usr/bin/env python#encoding=utf8list=range(1,15)print listdef show(number,list): try: idx=list.index(number) print idx except: return list[:5] a=idx-2 b=idx+2 start,end=None,None if ... 阅读全文
posted @ 2010-08-03 12:08
lexus
阅读(284)
评论(0)
推荐(0)
摘要:
百度首页用的是gb2312,这个和早期的设定肯关系,另外一个是面向国内也没必要utf8,第三是占用的空间小一倍,而结果页面使用gbk是因为抓取页面的字符集,比较广泛,不像首页百度能自己决定。 阅读全文
posted @ 2010-08-02 19:11
lexus
阅读(180)
评论(0)
推荐(0)
摘要:
http://www.92pifa.com/Product/?Show_3547.htmlhttp://code.google.com/p/httplib2/wiki/Examples首先,到92pifa的首页,然后使用Live HTTP headers对提交登录的请求进行分析最后我们使用如下代码提交请求,并且获取返回的set-cookie的键值http = httplib2.Http()url ... 阅读全文
posted @ 2010-08-01 18:12
lexus
阅读(762)
评论(0)
推荐(0)
摘要:
http://parkmy.javaeye.com/blog/423440然后上网一查,虽然没有查出上述规则到底是什么地方出问题了,但是查出了一个解决办法,经过一试,果然可以匹配包括换行符在内的任意字符,以下为正确的正则表达式匹配规则: ([\s\S]*) 同时,也可以用 “([\d\D]*)”、“([\w\W]*)” 来表示。 阅读全文
posted @ 2010-07-31 13:31
lexus
阅读(167)
评论(0)
推荐(0)
摘要:
http://www.whatsmyip.org/http_compression/http://www.gidnetwork.com/tools/gzip-test.php 阅读全文
posted @ 2010-07-31 10:52
lexus
阅读(388)
评论(0)
推荐(0)
摘要:
http://localhost:8080/solr/core0/select?q=收纳&rows=0&facet=true&facet.field=price&facet.query=price:[*+TO+20]&facet.query=price:[20+TO+*]当使用rows=0时没有返回结果,只进行facet query 阅读全文
posted @ 2010-07-31 10:01
lexus
阅读(191)
评论(0)
推荐(0)
摘要:
http://ubuntuforums.org/showthread.php?t=857320You need libglib2.0-dev (use synaptic to install it).pygobject-2.0libglib2.0-devpycairohttp://cairographics.org/pycairo/http://www.pygtk.org/downloads.ht... 阅读全文
posted @ 2010-07-29 23:49
lexus
阅读(980)
评论(0)
推荐(0)
摘要:
file(path.basename(url), 'wb').write(httpc.get(url))
http://ulaluma.com/pyx/archives/2008/12/lxml_eventlet_m.html 阅读全文
posted @ 2010-07-29 15:39
lexus
阅读(173)
评论(0)
推荐(0)
摘要:
http://oddments.org/?p=494 阅读全文
posted @ 2010-07-29 15:22
lexus
阅读(276)
评论(0)
推荐(0)
摘要:
sudo apt-get install meld 阅读全文
posted @ 2010-07-28 16:58
lexus
阅读(271)
评论(0)
推荐(0)
摘要:
默认是1000,可能是我在 ubuntu下unlimit -n没有调 ,或是python的httplib有问题,抓同一个站就抱错 r = h.getresponse() File "/usr/lib/python2.6/httplib.py", line 986, in getresponse response.begin() File "/usr/lib/python2.6/httplib.py... 阅读全文
posted @ 2010-07-28 15:04
lexus
阅读(889)
评论(0)
推荐(0)
摘要:
这个python的一个难题,大部分开源的python包或是其它的程序,目前和未来都会采用utf8,因此建议你用utf8,但是我们又用到gb2312,因为我们要做面向百度友好的站,因此我们只要保证,程序的输入和输出是gb2312内部还是utf8这样会比较简单,之前使用gb2312做默认文件编码,但是各个输入输出及库之间调用就搞混了,这个问题搞了两三天了, 阅读全文
posted @ 2010-07-27 23:40
lexus
阅读(184)
评论(0)
推荐(0)
|