上一页 1 2 3 4 5 6 7 ··· 11 下一页
摘要: clean_data 和 instance的区别 首先,clean_data和instance都是form对象调用的 语法: 区别: 阅读全文
posted @ 2019-06-23 22:17 想扣篮的小矮子 阅读(364) 评论(0) 推荐(0)
摘要: es的简单操作 我们在添加三篇文档,首先检查索引s18是否存在,不存在就先创建,存在则添加(更新)文档. 什么是elasticsearch? es的下载和安装 es快速上手 文档 阅读全文
posted @ 2019-06-23 22:11 想扣篮的小矮子 阅读(163) 评论(0) 推荐(0)
摘要: scrapy中间件 基于crawlSpider的全站数据爬取 实例代码: 爬虫文件代码: pipelines.py中 记得要在settings.py中打开管道 spider和selenium一起使用 实例代码: 爬虫文件代码.py middlewares.py中 在settings.py中我们要配置 阅读全文
posted @ 2019-06-20 09:41 想扣篮的小矮子 阅读(196) 评论(0) 推荐(0)
摘要: 顺序查找 查找原理: 实例代码: 对有序列表进行循环会提升查找的效率: 二分法查找(注意 : 二分法查找查找的对象必须是有序的) 概况: 实例代码: 二叉树 二叉树中有节点和树模型,这里我们要分别写节点和树模型. 节点: 空树模型: 遍历二叉树有两种方法: 广度优先遍历和深度优先遍历 广度优先遍历: 阅读全文
posted @ 2019-06-19 22:12 想扣篮的小矮子 阅读(495) 评论(0) 推荐(0)
摘要: scrapy的数据解析 scrapy的持久化存储 进行全站数据爬取 scrapy的五大核心组件 执行流程: 请求传参: 阅读全文
posted @ 2019-06-19 22:12 想扣篮的小矮子 阅读(160) 评论(0) 推荐(0)
摘要: 什么是selenium selenium是一款基于浏览器自动化的模块 和爬虫的关联: - 模拟登录 - 获取动态加载的数据 selenium如何获取动态加载的数据 环境安装 : pip install selenium 基本的使用情况: 结合着某一款浏览器驱动程序实例化一个浏览器对象 1.下载浏览器 阅读全文
posted @ 2019-06-17 22:22 想扣篮的小矮子 阅读(304) 评论(0) 推荐(0)
摘要: 爬虫中接触或者使用过那些数据解析的方式? 解析原理: bs4解析 用法 实例 xpath解析 用法: 实例: 分页处理: 懒加载: 我们在查看网页源码的时候发现,这里图片的有一个src属性储存的是图片地址,这是我们在网页的可视化界面中看到的,如图下: 但是我们发现,图片不在我们可视化范围内的图片的s 阅读全文
posted @ 2019-06-16 14:48 想扣篮的小矮子 阅读(743) 评论(0) 推荐(0)
摘要: 单线程+多任务异步协程: asyncio 异步操作的体现: 当将多个协程对象注册到事件循环中后,事件循环开启时,则会循环执行其内部的协程对象. 假如事件循环对象在执行某一个协程对象时,发生了阻塞,则事件循环会执行下一个协程对象 aiohttp模块: 支持异步的网络请求模块 查看中文文档 点击这里 实 阅读全文
posted @ 2019-06-14 20:13 想扣篮的小矮子 阅读(283) 评论(0) 推荐(0)
摘要: 模拟登录 实例:(这里使用的是超级鹰的打码平台) 技术点: 阅读全文
posted @ 2019-06-13 21:41 想扣篮的小矮子 阅读(132) 评论(0) 推荐(0)
摘要: 爬虫基础 什么是爬虫? 爬虫是通过程序模拟浏览器上网,从网上获取数据的过程. 爬虫的分类: 通用爬虫:爬取一整个页面的数据. 聚焦爬虫:爬取页面中指定的局部数据 增量式爬虫:检测网站中数据更新的情况,爬取的是网站中最新更新出来的数据. 什么是反爬机制? 网站制作时设置的一系列阻止爬虫程序进行的阻碍, 阅读全文
posted @ 2019-06-11 21:39 想扣篮的小矮子 阅读(195) 评论(0) 推荐(0)
上一页 1 2 3 4 5 6 7 ··· 11 下一页