摘要: 今日内容: scrapy各组件 Components: 1、引擎(EGINE) 引擎负责控制系统所有组件之间的数据流,并在某些动作发生时触发事件。有关详细信息,请参见上面的数据流部分。 2、调度器(SCHEDULER) 用来接受引擎发过来的请求, 压入队列中, 并在引擎再次请求的时候返回. 可以想像 阅读全文
posted @ 2019-06-21 19:25 辛周 阅读(98) 评论(0) 推荐(0)
摘要: 一、作业 二、、课堂笔记: 1、BeautifulSoup 解析库2、MongoDB 存储库3、requests-html 请求库 BeautifulSoup1、什么bs4,为什么要使用bs4? 是一个基于re开发的解析库,可以提供一些强大的解析功能。 提高提取数据的效率与爬虫开发效率。 2、安装与 阅读全文
posted @ 2019-06-21 08:59 辛周 阅读(154) 评论(0) 推荐(0)
摘要: 破解极限滑动认证 from selenium import webdriver from selenium.webdriver import ActionChains from PIL import Image import time import random # 截取图片函数 def cut_image(driver): driver.save_screenshot('image.... 阅读全文
posted @ 2019-06-21 08:14 辛周 阅读(170) 评论(0) 推荐(0)