刚刚闲着无聊,随便写了一个抓取博客园的py
摘要:
只抓第一页没有重复抓取验证、没有sleep ; 哈哈想抓更多调用call_me就好了(排版有点淡淡的疼)#!/usr/bin/python# -*- coding: utf-8 -*-from pyquery import PyQuery as pqfrom lxml import etreeimport sysimport reimport urllibimport urllib2import jsonimport hashlibimport randomimport timeimport osimport cookielibimport writetemp#抓取调用函数def call_m 阅读全文
posted @ 2013-06-17 20:45 牛-_-蜗 阅读(648) 评论(0) 推荐(0)
浙公网安备 33010602011771号