大鱼小吴 - 博客园

2016年10月27日

摘要： 1 #coding:utf-8 2 #爬取原理主要是利用豆瓣api https://movie.douban.com/j/search_subjects?逐层过滤，并获取最初的json数据，根据json列表中每一个电影的原地址，再次访问，并利用xpath提取评分，提取完成之后再分类别存入xml文档 3 import requests 4 import json 5 import re ... 阅读全文

posted @ 2016-10-27 16:04 大鱼小吴阅读(1143) 评论(0) 推荐(0)

2016年10月19日

百度贴吧python吧抓取用户名和图片

摘要：原理就是将贴吧条数中的用户提取出来并在此爬取用户中的图片阅读全文

posted @ 2016-10-19 16:09 大鱼小吴阅读(190) 评论(0) 推荐(0)