摘要: 使用到的 Python 库包括urllib,urllib2, cookielib由于目标网站使用简单的 form-submit 结构,所以可以省去很多事。基本过程是通过urllib2.build_opener() 建立新的打开链接的方式,这种打开方式包含 cookie 信息,从而维护一个登录的 session,然后依据这个 session 以登录用户的身份查询信息。借用了[1]中的一些代码,最后的样子如下class Crawl(object): def __init__(self): self.operation = None # 初始化一个CookieJar... 阅读全文
posted @ 2014-02-25 21:38 LF1205 阅读(475) 评论(0) 推荐(0)