摘要: 今日内容: 一 Selenium剩余部分 二 BeautifulSoup4 一 Selenium剩余部分 1.元素交互操作: - 点击、清除 click clear - ActionChains 是一个动作链对象,需要把driver驱动传给它。 动作链对象可以操作一系列设定好的动作行为。 - ifr 阅读全文
posted @ 2019-07-03 21:25 chiningmeng 阅读(313) 评论(0) 推荐(0)
摘要: 请求URL: https://movie.douban.com/top250 请求方式: GET 请求头: user-agent Cookies 爬取豆瓣信息: 电影名称,电影url,电影导演 电影主演,电影年份,电影类型 电影评分,电影评论,电影简介 分析所有主页的url 第一页:https:// 阅读全文
posted @ 2019-07-02 21:37 chiningmeng 阅读(203) 评论(0) 推荐(0)
摘要: 爬虫课程: 一.爬虫的基本原理二.requests请求库爬虫的基本原理 1.什么是爬虫 爬虫是抓取数据2.什么是互联网 由一堆网络设备,把一台台的计算机互联到一起称之为互联网 3.互联网建立的目的 数据的传递与数据的共享4.什么是数据 例如:电商平台的商品数据链接,信息… 打开浏览器 →输入地址 → 阅读全文
posted @ 2019-07-01 16:55 chiningmeng 阅读(213) 评论(0) 推荐(0)