摘要: 在介绍Python中的线程之前,先明确一个问题,Python中的多线程是假的多线程! 为什么这么说,我们先明确一个概念,全局解释器锁(GIL) 什么是GIL Python代码的执行由Python虚拟机(解释器)来控制,同时只有一个线程在执行。对Python虚拟机的访问由全局解释器锁(GIL)来控制, 阅读全文
posted @ 2018-07-03 11:46 诚实善良小郎君 阅读(410) 评论(0) 推荐(0) 编辑
摘要: 1 多线程抓取 2 多协程抓取 3 多进程抓取 4 多线程加协程 5 多进程加协程 阅读全文
posted @ 2018-07-02 10:03 诚实善良小郎君 阅读(191) 评论(0) 推荐(0) 编辑
摘要: 1 绘制条形图 2 绘制智联招聘职位岗位数量图 3 词云 “词云”这个概念由美国西北大学新闻学副教授、新媒体专业主任里奇·戈登(Rich Gordon)提出。“词云”就是对网络文本中出现频率较高的“关键词”予以视觉上的突出,形成“关键词云层”或“关键词渲染”,从而过滤掉大量的文本信息,使浏览网页者只 阅读全文
posted @ 2018-06-30 10:07 诚实善良小郎君 阅读(684) 评论(0) 推荐(0) 编辑
摘要: (1)字符串反转 1倒序输出 2 列表reverse()操作 3 二分法交换位置 4 列表生成式 5 栈的思想 6 递归的思路 (2)冒泡排序 采用循环 采用数组中的partition,用递归实现 传入的第一个参数是 ,即函数对象本身。由于结果 是一个 ,`Iterator list()`函数让它把 阅读全文
posted @ 2018-06-29 08:51 诚实善良小郎君 阅读(359) 评论(0) 推荐(0) 编辑
摘要: 1 jsonPath数据格式 pip安装: pip install jsonpath 用来解析json格式的字符串,类似于xpath (1) json对象的转换 (2) XPath与jsonPath格式对比 | XPath | JSONPath | Description | | | | | | / 阅读全文
posted @ 2018-06-28 20:54 诚实善良小郎君 阅读(343) 评论(0) 推荐(0) 编辑
摘要: 爬虫入门之爬取策略 XPath与bs4实现(五) 在爬虫系统中,待抓取URL队列是很重要的一部分。待抓取URL队列中的URL以什么样的顺序排列也是一个很重要的问题,因为这涉及到先抓取那个页面,后抓取哪个页面。而决定这些URL排列顺序的方法,叫做抓取策略。下面重点介绍几种常见的抓取策略: 1 深度优先 阅读全文
posted @ 2018-06-27 21:08 诚实善良小郎君 阅读(740) 评论(1) 推荐(0) 编辑
摘要: 1 Requests模块解析 Requests 唯一的一个非转基因的 Python HTTP 库,人类可以安全享用 Requests 继承了urllib2的所有特性。Requests支持HTTP连接保持和连接池,支持使用cookie保持会话,支持文件上传,支持自动确定响应内容的编码,支持国际化的 U 阅读全文
posted @ 2018-06-27 09:32 诚实善良小郎君 阅读(473) 评论(0) 推荐(1) 编辑
摘要: 1 自定义opener opener是 urllib.request.OpenerDirector 的实例,我们之前一直都在使用的urlopen,它是一个特殊的模块构建好的opener 但是基本的urlopen()方法 不支持代理、cookie等其他的HTTP/HTTPS高级功能 。所以要支持这些功 阅读全文
posted @ 2018-06-25 19:23 诚实善良小郎君 阅读(673) 评论(0) 推荐(0) 编辑
摘要: 1 下载与解压 2 移动安装文件 3 添加环境变量 4 添加配置文件 5 创建目录文件 6 编辑启动项下的文件 python sudo vim /etc/init.d/mongodb 执行的脚本 !/bin/sh BEGIN INIT INFO Provides: mongodb Required 阅读全文
posted @ 2018-06-24 18:20 诚实善良小郎君 阅读(313) 评论(0) 推荐(0) 编辑
摘要: nginx静态文件配置 nginx + 反向代理 + runserver nginx + uwsgi启动 nginx + 负载均衡 阅读全文
posted @ 2018-06-24 10:58 诚实善良小郎君 阅读(307) 评论(0) 推荐(0) 编辑