06 2019 档案
摘要:楔子 PIL 是一个专门用来处理图像的模块,可以对图象进行各种各样的变换,下面我们就来看看这个模块用法。 首先需要安装,直接 pip install pillow 即可。 打开一张图片 首先是打开图片,可以使用 PIL 中的 Image.open 函数: from PIL import Image
阅读全文
摘要:楔子 什么是词云?在网络上我们经常可以看到一张图片,上面有一大堆大小不一的文字,便是词云。词云一般是根据输入的大量词语生成的,如果某个词语出现的次数越多,那么相应的大小就会越大。我们后面演示的时候就知道了 安装 python中有一个专门用来生成词云的模块:wordcloud,如果在linux上直接
阅读全文
摘要:楔子 数据序列化、或持久化,就是把数据从内存刷到磁盘上。但是要保证在读取的时候还能恢复到原来的状态。像 pickle 和 json 之类的持久化模块基本上无需介绍了,这里介绍两个其他很少用但是功能很强大的模块。 dbm 在一些小型程序中,不需要关系型数据库时,可以方便的用持久字典来存储键值对,和py
阅读全文
摘要:介绍 xpath语法 /:在子节点里面找 //:在子子孙孙节点里面找 //div:查找当前网页的所有div标签 //div/p:先找到所有的div标签,再从div的字标签中找p标签 //div//p:先找到所有的div标签,再从div的子孙标签中找p标签 //div/a:先查找所有div标签,再从d
阅读全文
摘要:楔子 相信很多人都用 Nginx 搭建过反向代理服务器,但其实这仅仅只是 Nginx 的一些最基本的用法,我们还需要熟悉 Nginx 底层的运行原理,比如:Nginx 的架构、进程模型,以及 Liunx 中的 CPU、内存、磁盘、网络等等要如何与 Nginx 配置文件中的指令相结合从而使得 Ngin
阅读全文
摘要:logging模块简介 logging模块的基本使用 将日志写入文件 此时1.txt文件内容如下 而且此时并没有输出到控制台,但如果我同时也想输出到控制台呢?并且我想为输出到文件和输出到控制台设置不同的等级,文件我想记录的简单一点,但是控制台我想看的详细一点,怎么办呢? 将日志同时写到文件和控制台
阅读全文
摘要:介绍 分词 添加自定义词典 自定义的词典格式如下: 词语 词频(可省略) 词性(可省略) 至于词频和词性后面会说 自定义一个1.txt文件,里面包含内容如下 关键词提取 TF IDF(Term Frequency Inverse Document Frequency, 词频 逆文件频率) 一个词语在
阅读全文
摘要:介绍 创建枚举类型 名称或者值相同 成员的值是否可变 强制让成员的值不一样 比较成员的值 python import enum 换一种继承的类,改成IntEnum class Color(enum.IntEnum): red = 1 green = 2 blue = 3 yellow = 4 pin
阅读全文
摘要:并发任务池 concurrent.futures 模块提供了使用线程池或进程池运行任务的接口,线程池和进程池的API是一致的,所以应用只需要做最小的修改就可以在线程和进程之间进行切换。 这个模块提供了两种类型的类与这些池交互:执行器(executor)用来管理工作线程或进程池,future用来管理计
阅读全文
摘要:楔子 pandas支持的功能已经非常强大了,但是本着程序猿的"懒惰"精神,还是想少写一点代码的。pandas中的某些方法不仅可以实现我们需要的功能,还可以减少一定的代码量,我们来看一下。 df.assign 这个方法估计有人没怎么用过,因为我们不用它也完全可以实现,那么它是干什么的呢?我们来看一下:
阅读全文
摘要:楔子 如果使用 Python 爬虫,那么首先想到的就是 requests,requests 唯一的一个非转基因的 Python HTTP 库,人类可以安全享用。 Requests 允许你发送纯天然、植物饲养的 HTTP/1.1 请求,无需手工劳动。你不需要手动为 URL 添加查询字串,也不需要对 P
阅读全文
摘要:K近邻算法基础 我们来介绍一下K近邻算法,这个算法应该说是机器学习中最简单的一个算法了,不过它虽然简单、但也有很多有点,比如: 思想极度简单 使用的数学知识很少(近乎为0) 对于一些特定的数据集有非常好的效果 可以解释机器学习算法使用过程中的很多细节问题 更完整地刻画机器学习应用的流程 那么什么是K
阅读全文
摘要:楔子 SQL 是每个开发人员都应该掌握的,很多人可能觉得 SQL 没啥大不了的,但是说真的,SQL要是写好了,是很厉害的。下面我们来从零开始学习SQL。 基本概念 正如 Linux 中一切皆文件,Python中一切皆对象,SQL(Structured Query Language,结构化查询语言)中
阅读全文
摘要:使用 threading 模块中的 Timer 类 使用 threading 中的 Timer 可以简单实现一个定时器的功能: from threading import Timer import time def execute_func(name, age, gender, hobby): pr
阅读全文