摘要: numpy pandas之基础 pandas 之处理丢失数据 pandas之数据处理 Matplotlib 阅读全文
posted @ 2019-06-27 10:50 言值 阅读(152) 评论(0) 推荐(0)
摘要: [TOC] 基础知识 包含单条曲线的图 包含多个曲线的图 未完待续... 阅读全文
posted @ 2019-06-27 10:48 言值 阅读(100) 评论(0) 推荐(0)
摘要: [TOC] 删除重复元素 (duplicated) 映射 (replace) Series替换操作 DataFrame替换操作 map函数 排序 数据分类处理 (重点) 分组 高级数据聚合 阅读全文
posted @ 2019-06-27 10:47 言值 阅读(1675) 评论(0) 推荐(0)
摘要: [TOC] pandas中的None与NaN pandas处理空值操作 创建多层列索引 pandas的拼接操作 pd.concat()级联 pd.merge()合并 阅读全文
posted @ 2019-06-27 10:46 言值 阅读(1682) 评论(0) 推荐(0)
摘要: [TOC] 简介 Series Series的索引和切片 Series的基本概念 Series的运算 DataFrame DataFrame的索引 切片 DataFrame的运算 阅读全文
posted @ 2019-06-27 10:45 言值 阅读(302) 评论(0) 推荐(0)
摘要: [TOC] 概念 创建ndarray 使用np的routines函数创建 ndarray的属性 ndarray的基本操作 级联 ndarray的聚合操作 ndarray的排序 阅读全文
posted @ 2019-06-27 10:43 言值 阅读(233) 评论(0) 推荐(0)
摘要: 网络知识 Requests模块 数据解析 验证码、Cookie、IP等处理方式 Selenium 异步爬虫 Scrapy的初识 Scrapy的核心 Scrapy之下载中间件 Scrapy中Selenium的应用 Scrapy之CrawlSpider 分布式爬虫 增量式爬虫 Scrapy之处理文件 超 阅读全文
posted @ 2019-06-27 10:34 言值 阅读(109) 评论(0) 推荐(0)
摘要: 超级鹰实现12306模拟登录 阅读全文
posted @ 2019-06-27 10:25 言值 阅读(2003) 评论(0) 推荐(0)
摘要: [TOC] FilesPipeline ImagesPipeline | | FilesPipelin | ImagesPipeline | | | | | | Package | scrapy.pipelines.files.FilesPipeline | scrapy.pipelines.ima 阅读全文
posted @ 2019-06-27 10:23 言值 阅读(821) 评论(0) 推荐(0)
摘要: [TOC] 简介 示例 爬取www.4567tv.tv电影网 爬取糗事百科 阅读全文
posted @ 2019-06-27 10:22 言值 阅读(334) 评论(0) 推荐(0)
摘要: [TOC] redis分布式部署 示例 阅读全文
posted @ 2019-06-27 10:21 言值 阅读(83) 评论(0) 推荐(0)
摘要: [TOC] 简介 创建 爬虫文件 示例 爬取boss直聘 阅读全文
posted @ 2019-06-27 10:20 言值 阅读(131) 评论(0) 推荐(0)
摘要: [TOC] 描述 案例分析 selenium在scrapy中使用流程 示例代码 爬虫文件以及构造selenium 下载中间件process_response方法 配置文件 管道持久化存储 阅读全文
posted @ 2019-06-27 10:19 言值 阅读(746) 评论(0) 推荐(0)
摘要: [TOC] 下载中间件的使用 settings 配置 User Agent池 代理池 阅读全文
posted @ 2019-06-27 10:17 言值 阅读(468) 评论(0) 推荐(0)
摘要: [TOC] 基于管道的持久化存储 爬取多页面数据(全站爬取) python 1.将每一个页码对应的url存放到爬虫文件的起始url列表(start_urls)中。(不推荐) 2.使用Request方法手动发起请求 第一步: 设定一个通用的url模板 pageNum = 1 起始页码 url = 'h 阅读全文
posted @ 2019-06-27 10:16 言值 阅读(257) 评论(0) 推荐(0)
摘要: [TOC] 简介 安装 基础使用 目录结构 爬虫文件 settings.py 配置文件 示例 爬取糗图百科 阅读全文
posted @ 2019-06-27 10:14 言值 阅读(107) 评论(0) 推荐(0)
摘要: [TOC] 多线程 线程池爬取梨视频 单线程 + 异步协程 asyncio 模块 实例 asyncio + aiohttp 实现协程 回调函数用于解析数据 模拟服务器 阅读全文
posted @ 2019-06-27 10:13 言值 阅读(205) 评论(0) 推荐(0)
摘要: [TOC] 简介 浏览器创建 元素定位 节点交互 动作链 执行JavaScript 获取页面源码数据 前进和后退 cookie处理 异常处理 phantomJS 谷歌无头浏览器 selenium 规避被检测识别 示例 登录qq空间,爬取数据 爬取豆瓣网中的电影信息 阅读全文
posted @ 2019-06-27 10:11 言值 阅读(209) 评论(0) 推荐(0)
摘要: [TOC] 验证码 代理 IP cookie的应用和处理 图片懒加载 实例 人人网进行登陆校验 利用不同的代理ip进行访问 基于cookie的案例分析: 爬取www.xueqiu.com 阅读全文
posted @ 2019-06-27 10:09 言值 阅读(1367) 评论(1) 推荐(0)
摘要: [TOC] 基础知识 数据爬取流程 实现数据解析的三种方式 数据解析原理 bs4 数据解析 相关的属性和方法 xpath数据解析 常用xpath表达式 xpath示例内容 处理编码的方式 相关案例 处理频繁请求问题 案例 urllib 模块爬取图片 利用 bs4 进行数据分析爬取小说 利用xpath 阅读全文
posted @ 2019-06-27 10:06 言值 阅读(507) 评论(0) 推荐(0)
摘要: [TOC] 简介 案例 1. 爬取搜狗制定词条搜索后的页面数据 2. 登录豆瓣电影,爬取登录成功后的页面数据 3. 爬取豆瓣电影分类排行榜中的电影详情数据 4.爬取百度翻译, 获取返回结果的数据 5.爬取肯德基餐厅查询中指定地点的餐厅数据 6.爬取国家药品监督管理总局中基于中华人民共和国化妆品生产许 阅读全文
posted @ 2019-06-27 10:03 言值 阅读(169) 评论(0) 推荐(0)
摘要: 数据结构&算法 基本数据结构-栈 基本数据结构-队列 基本数据结构-顺序表和链表 二叉树 排序算法 查找算法 时间复杂度 阅读全文
posted @ 2019-06-27 09:55 言值 阅读(96) 评论(0) 推荐(0)
摘要: [TOC] 计算步骤 python 求解算法的时间复杂度的具体步骤是: ⑴ 找出算法中的基本语句; 算法中执行次数最多的那条语句就是基本语句,通常是最内层循环的循环体。 ⑵ 计算基本语句的执行次数的数量级; 只需计算基本语句执行次数的数量级,这就意味着只要保证基本语句执行次数的函数中的最高次幂正确即 阅读全文
posted @ 2019-06-27 09:48 言值 阅读(426) 评论(0) 推荐(0)
摘要: [TOC] 顺序查找 无序查找 hash查找 阅读全文
posted @ 2019-06-27 09:47 言值 阅读(113) 评论(0) 推荐(0)
摘要: [TOC] 冒泡排序 选择排序 python def sort(alist): length = len(alist) for j in range(length 1, 0, 1): 最大值元素的下标 max_index = 0 for i in range(1, j+1): if alist[ma 阅读全文
posted @ 2019-06-27 09:44 言值 阅读(135) 评论(0) 推荐(0)
摘要: [TOC] 树 概念 二叉树 二叉树特点、性质 分类 python 1. 斜树:所有的结点都只有左子树的二叉树叫左斜树。所有结点都是只有右子树的二叉树叫右斜树。统称为斜树。 2. 满二叉树:在一棵二叉树中。如果所有分支结点都存在左子树和右子树,并且所有叶子都在同一层上,这样的二叉树称为满二叉树。 1 阅读全文
posted @ 2019-06-27 09:40 言值 阅读(253) 评论(0) 推荐(0)
摘要: [TOC] 内存 顺序表 链表 Python实现单链表 python 封装节点数据结构 class Node(): def __init__(self, item): self.item = item 存储下一个节点的地址 self.next = None def __str__(self): re 阅读全文
posted @ 2019-06-27 09:38 言值 阅读(258) 评论(0) 推荐(0)
摘要: [TOC] 队列 概念 应用 Python实现队列 案例: 烫手的山芋 基本数据结构 双端队列 (Deque) 双端队列 Python实现Deque 案例: 回文检测 阅读全文
posted @ 2019-06-27 09:34 言值 阅读(246) 评论(0) 推荐(0)
摘要: [TOC] 线性数据结构 栈 Python实现栈 阅读全文
posted @ 2019-06-27 09:25 言值 阅读(144) 评论(0) 推荐(0)
摘要: [TOC] 引言 计算机科学 算法 案例引导 意义 算法分析 问题 时间复杂度 案例分析 python 常见时间复杂度:O(1) 阅读全文
posted @ 2019-06-27 09:23 言值 阅读(283) 评论(0) 推荐(0)
摘要: MongoDB基础篇 MongoDB 之 $ 关键字 python操作MongoDB 阅读全文
posted @ 2019-06-27 09:01 言值 阅读(116) 评论(0) 推荐(0)
摘要: [TOC] 高级查询 比较运算型 update修改器 "$" 关键字 MongoDB 之特殊关键字 阅读全文
posted @ 2019-06-27 08:58 言值 阅读(3546) 评论(0) 推荐(1)
摘要: [TOC] 连接MongoDB MongoDB的增删改查 增 查 / 更新 删 "_id" 的转换 阅读全文
posted @ 2019-06-27 08:58 言值 阅读(923) 评论(0) 推荐(0)
摘要: [TOC] 简介 MongDB的使用和创建 MongoDB之增删改查 增 查 改 删 MongoDB的数据类型 MongoDB中的数据表,数据行,数据列 | | MySQL | MongoDB | | | | | | 数据表 | table | Collections | | 数据行 | row | 阅读全文
posted @ 2019-06-27 08:56 言值 阅读(137) 评论(0) 推荐(0)
摘要: 初识数据库 存储引擎 MySQL之表操作 MySQL的数据类型 MYSQL 表的完整性约束 数据库之记录操作 数据库查询之单表查询 MySQL之l索引原理 数据库查询之多表查询 Python操作MySQL数据库 阅读全文
posted @ 2019-06-27 08:49 言值 阅读(154) 评论(0) 推荐(0)