会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
吼嘿嘿吼
博客园
首页
新随笔
联系
订阅
管理
2019年7月4日
DAY-04
摘要: 爬取豌豆荚多页app数据
阅读全文
posted @ 2019-07-04 09:28 吼嘿嘿吼
阅读(95)
评论(0)
推荐(0)
2019年7月3日
爬取豌豆荚app数据
摘要: 方法一:requests+bs4 方法二:selenium
阅读全文
posted @ 2019-07-03 21:04 吼嘿嘿吼
阅读(315)
评论(0)
推荐(0)
DAY-03
摘要: 上午 selenium元素交互操作 ——点击、清除 ——Actions Chains 动作链对象,需要把driver驱动传给它。 动作链对象可以操作一系列设定好的动作行为 ——frame的切换 1.方式一:起始目标向重点目标 瞬间移动 2.方式二:缓慢移动 ——执行js代码 前进后退 爬取京东商品信
阅读全文
posted @ 2019-07-03 11:27 吼嘿嘿吼
阅读(126)
评论(0)
推荐(0)
2019年7月2日
DAY-02
摘要: 爬取豆瓣网站电影top250 Selenium请求库 1.什么是Selenium 起初是一个自动化测试工具,原理是驱动浏览器执行一些已定好的操作。 爬虫本质上就是模拟浏览器,所以可以使用它来做爬虫 2.为什么要使用Selenium 优点: ——执行js代码 ——不需要分析复杂的通信流程 ——对浏览器
阅读全文
posted @ 2019-07-02 12:43 吼嘿嘿吼
阅读(244)
评论(0)
推荐(0)
2019年7月1日
DAY-01
摘要: 上午: 一、爬虫基本原理 1. 什么是爬虫? 爬取数据 2. 什么是互联网? 由一堆网络设备,把一台台的计算机互联到一起 3. 互联网建立的目的 数据的传递与分享 4. 什么是数据? 例如:电商平台的商品信息 链家、自如的房源信息 股票证券投资信息(雪球网,东方财富) 12306的票务信息 5. 什
阅读全文
posted @ 2019-07-01 14:53 吼嘿嘿吼
阅读(90)
评论(0)
推荐(0)
公告