GroundControl_852

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

05 2020 档案

摘要:- 需求 爬起链家深圳二手房的详情信息,存储到excel表中.并对深圳二手房数据进行分析 以下数据只是简单的获取第一页的二手房源信息,通过xlwt写入excel并保存 from lxml import etree import requests import xlwt import re # 1.构 阅读全文
posted @ 2020-05-16 14:31 GroundControl_852 阅读(359) 评论(0) 推荐(0)

摘要:豆瓣电视剧爬虫 # coding=utf-8 import requests import json class DoubanSpider(): def __init__(self): self.url_temp_list=[ {"url_temp":"https://m.douban.com/re 阅读全文
posted @ 2020-05-08 17:12 GroundControl_852 阅读(353) 评论(0) 推荐(1)

摘要:爬取思路 清楚爬取需求,我们要爬取电影名字,导演名字,电影上映时间,电影类型,制片国家,评分人数和电影简介 首先从网页上分析,网页数据不是由ajax抓取,因此我们直接用这个网站url发送请求获取数据,从网页源码上看我们可以从第一层网页中获取到影名字,导演名字,电影上映时间,电影类型,制片国家,评分人 阅读全文
posted @ 2020-05-08 16:52 GroundControl_852 阅读(377) 评论(0) 推荐(0)