2013年6月17日

刚刚闲着无聊,随便写了一个抓取博客园的py

摘要: 只抓第一页没有重复抓取验证、没有sleep ; 哈哈想抓更多调用call_me就好了(排版有点淡淡的疼)#!/usr/bin/python# -*- coding: utf-8 -*-from pyquery import PyQuery as pqfrom lxml import etreeimport sysimport reimport urllibimport urllib2import jsonimport hashlibimport randomimport timeimport osimport cookielibimport writetemp#抓取调用函数def call_m 阅读全文

posted @ 2013-06-17 20:45 牛-_-蜗 阅读(648) 评论(0) 推荐(0)

导航