公告

05 2020 档案

摘要：- 需求爬起链家深圳二手房的详情信息,存储到excel表中.并对深圳二手房数据进行分析以下数据只是简单的获取第一页的二手房源信息,通过xlwt写入excel并保存 from lxml import etree import requests import xlwt import re # 1.构阅读全文

posted @ 2020-05-16 14:31 GroundControl_852 阅读(359) 评论(0) 推荐(0)

requests爬取豆瓣

摘要：豆瓣电视剧爬虫 # coding=utf-8 import requests import json class DoubanSpider(): def __init__(self): self.url_temp_list=[ {"url_temp":"https://m.douban.com/re 阅读全文

posted @ 2020-05-08 17:12 GroundControl_852 阅读(353) 评论(0) 推荐(1)

scrapy框架爬取豆瓣电影Top250

摘要：爬取思路清楚爬取需求,我们要爬取电影名字,导演名字,电影上映时间,电影类型,制片国家,评分人数和电影简介首先从网页上分析,网页数据不是由ajax抓取,因此我们直接用这个网站url发送请求获取数据,从网页源码上看我们可以从第一层网页中获取到影名字,导演名字,电影上映时间,电影类型,制片国家,评分人阅读全文

posted @ 2020-05-08 16:52 GroundControl_852 阅读(377) 评论(0) 推荐(0)