吼嘿嘿吼

2019年7月4日

DAY-04

摘要：爬取豌豆荚多页app数据阅读全文

posted @ 2019-07-04 09:28 吼嘿嘿吼阅读(100) 评论(0) 推荐(0)

2019年7月3日

爬取豌豆荚app数据

摘要：方法一：requests+bs4 方法二：selenium 阅读全文

posted @ 2019-07-03 21:04 吼嘿嘿吼阅读(321) 评论(0) 推荐(0)

DAY-03

摘要：上午 selenium元素交互操作 ——点击、清除 ——Actions Chains 动作链对象，需要把driver驱动传给它。动作链对象可以操作一系列设定好的动作行为 ——frame的切换 1.方式一：起始目标向重点目标瞬间移动 2.方式二：缓慢移动 ——执行js代码前进后退爬取京东商品信阅读全文

posted @ 2019-07-03 11:27 吼嘿嘿吼阅读(135) 评论(0) 推荐(0)

2019年7月2日

DAY-02

摘要：爬取豆瓣网站电影top250 Selenium请求库 1.什么是Selenium 起初是一个自动化测试工具，原理是驱动浏览器执行一些已定好的操作。爬虫本质上就是模拟浏览器，所以可以使用它来做爬虫 2.为什么要使用Selenium 优点： ——执行js代码 ——不需要分析复杂的通信流程 ——对浏览器阅读全文

posted @ 2019-07-02 12:43 吼嘿嘿吼阅读(259) 评论(0) 推荐(0)

2019年7月1日

DAY-01

摘要：上午：一、爬虫基本原理 1. 什么是爬虫？爬取数据 2. 什么是互联网？由一堆网络设备，把一台台的计算机互联到一起 3. 互联网建立的目的数据的传递与分享 4. 什么是数据？例如：电商平台的商品信息链家、自如的房源信息股票证券投资信息（雪球网，东方财富） 12306的票务信息 5. 什阅读全文

posted @ 2019-07-01 14:53 吼嘿嘿吼阅读(100) 评论(0) 推荐(0)

公告