12 2014 档案
摘要:#!/usr/bin/python# -*- coding: utf-8 -*- import re;import sys;import cookielib;import urllib;import urllib2;import optparse;import json;import httplib...
阅读全文
摘要:用Python实现常规的静态网页抓取时,往往是用urllib2来获取整个HTML页面,然后从HTML文件中逐字查找对应的关键字。如下所示:import urllib2url="http://mm.taobao.com/json/request_top_list.htm?type=0&page=1"u...
阅读全文

浙公网安备 33010602011771号