_DL - 博客园

2019年7月4日

摘要：今日内容： - 爬取豌豆荚爬取豌豆荚： 1.访问游戏主页 https://www.wandoujia.com/category/6001 2.点击查看更多，观察network内的请求 - 请求url page2: https://www.wandoujia.com/wdjweb/api/catego 阅读全文

posted @ 2019-07-04 09:25 _DL 阅读(187) 评论(0) 推荐(0)

2019年7月3日

Day 03

摘要：昨日回顾: 一爬取豆瓣电影TOP250 1.爬取电影页 2.解析提取电影信息 3.保存数据二 Selenium请求库驱动浏览器往目标网站发送请求，获取响应数据。 - 不需要分析复杂的通信流程 - 执行js代码 - 获取动态数据三 selenium使用 driver = webdriver.C 阅读全文

posted @ 2019-07-03 17:56 _DL 阅读(187) 评论(0) 推荐(0)

2019年7月2日

Day 02

摘要：昨日回顾：一爬虫基本原理 - 爬虫全过程 1.发送请求 2.接受响应数据 3.解析并提取有价值的数据 4.保存数据二 Requests请求库 - GET url headers cookies - POST url headers cookies data 三爬取校花网视频 1.通过主页解析阅读全文

posted @ 2019-07-02 18:57 _DL 阅读(288) 评论(0) 推荐(1)

2019年7月1日

Day 01

摘要：今日内容：爬虫课程：一爬虫基本原理二 request请求库一爬虫基本原理 1、什么是爬虫？爬虫就是爬取数据 2、什么是互联网？由一堆网络设备，把一台台计算机互联到一起称之为互联网。 3、互联网建立的目的数据的传递与数据的共享 4、什么是数据？例如：电商平台的商品信息（）链家、自如阅读全文

posted @ 2019-07-01 14:47 _DL 阅读(195) 评论(0) 推荐(0)