摘要:
1 #coding:utf-8 2 #爬取原理主要是利用豆瓣api https://movie.douban.com/j/search_subjects?逐层过滤,并获取最初的json数据,根据json列表中每一个电影的原地址,再次访问,并利用xpath提取评分,提取完成之后再分类别存入xml文档 3 import requests 4 import json 5 import re ... 阅读全文
posted @ 2016-10-27 16:04
大鱼小吴
阅读(1142)
评论(0)
推荐(0)
浙公网安备 33010602011771号