1.分析 ,要抓取的页面的信息以及对应的源码信息

  blog.sina.com.cn/s/blog 93dc666c0101b1bj.html

  

    

  2.代码模块:

  

    

  导入正则表达的模块

  导入url相关的模块

  利用page。read()获取页面的信息,再将页面当做字符串,传入到getImg方法内,利用正则表达式,匹配你要的字符串信息,然后,在利用urllib包的urlretrieve()下载,你要的图片。

  这个是urllib模块内的方法的详解:http://www.jb51.net/article/42630.htm

  

  

posted on 2015-07-15 22:46  新猪先生  阅读(252)  评论(0编辑  收藏  举报