12 2014 档案

摘要:#!/usr/bin/python# -*- coding: utf-8 -*- import re;import sys;import cookielib;import urllib;import urllib2;import optparse;import json;import httplib... 阅读全文
posted @ 2014-12-30 10:41 Stuxnet 阅读(2509) 评论(1) 推荐(0)
摘要:用Python实现常规的静态网页抓取时,往往是用urllib2来获取整个HTML页面,然后从HTML文件中逐字查找对应的关键字。如下所示:import urllib2url="http://mm.taobao.com/json/request_top_list.htm?type=0&page=1"u... 阅读全文
posted @ 2014-12-25 00:01 Stuxnet 阅读(32817) 评论(2) 推荐(1)