随笔分类 -  Python

K-近邻算法(KNN)
摘要:k-近邻算法原理 简单地说,K-近邻算法采用测量不同特征值之间的距离方法进行分类。 优点:精度高(计算距离)、对异常值不敏感(单纯根据距离进行分类,会忽略特殊情况)、无数据输入假定(不会对数据预先进行判定)。 缺点:时间复杂度高、空间复杂度高。 适用数据范围:数值型和标称型。 工作原理 存在一个样本 阅读全文
posted @ 2019-11-25 14:03 cs_1993 阅读(614) 评论(0) 推荐(0)
matplotlib
摘要:Matplotlib基础知识 Matplotlib中的基本图表包括的元素 x轴和y轴 axis水平和垂直的轴线 x轴和y轴刻度 tick刻度标示坐标轴的分隔,包括最小刻度和最大刻度 x轴和y轴刻度标签 tick label表示特定坐标轴的值 绘图区域(坐标系) axes实际绘图的区域 坐标系标题 t 阅读全文
posted @ 2019-11-19 11:41 cs_1993 阅读(280) 评论(0) 推荐(0)
SQLAlchemy
摘要:介绍 SQLAlchemy是一个基于Python实现的ORM框架。该框架建立在 DB API之上,使用关系对象映射进行数据库操作,简言之便是:将类和对象转换成SQL,然后使用数据API执行SQL并获取执行结果。 安装 pip3 install sqlalchemy SQLAlchemy本身无法操作数 阅读全文
posted @ 2019-11-15 13:42 cs_1993 阅读(141) 评论(0) 推荐(0)
数据分析案例
摘要:人口分析案例 需求: 导入文件,查看原始数据 将人口数据和各州简称数据进行合并 将合并的数据中重复的abbreviation列进行删除 查看存在缺失数据的列 找到有哪些state/region使得state的值为NaN,进行去重操作 为找到的这些state/region的state项补上正确的值,从 阅读全文
posted @ 2019-11-14 17:41 cs_1993 阅读(643) 评论(0) 推荐(0)
Python常用模块(二)
摘要:一 hashlib加密 1 什么是hash Hash,一般翻译做“散列”,也有直接音译为”哈希”的,就是把任意长度的输入(又叫做预映射,pre-image),通过散列算法,变换成固定长度的输出,该输出就是散列值。这种转换是一种压缩映射,也就是,散列值的空间通常远小于输入的空间,不同的输入可能会散列成 阅读全文
posted @ 2019-09-30 10:07 cs_1993 阅读(242) 评论(0) 推荐(0)
分布式任务队列Celery的使用
摘要:一、简介 Celery是由Python开发、简单、灵活、可靠的分布式任务队列,其本质是生产者消费者模型,生产者发送任务到消息队列,消费者负责处理任务。Celery侧重于实时操作,但对调度支持也很好,其每天可以处理数以百万计的任务。特点: 简单:熟悉celery的工作流程后,配置使用简单 高可用:当任 阅读全文
posted @ 2019-09-29 14:12 cs_1993 阅读(323) 评论(0) 推荐(0)
Python常用模块(一)
摘要:一 模块的介绍与导入 1 模块的简介 在计算机程序的开发过程中,随着程序代码越写越多,在一个文件里代码就会越来越长,越来越不容易维护。 为了编写可维护的代码,我们把很多函数分组,分别放到不同的文件里,这样,每个文件包含的代码就相对较少,很多编程语言都采用这种组织代码的方式。在Python中,一个.p 阅读全文
posted @ 2019-09-27 15:06 cs_1993 阅读(264) 评论(0) 推荐(0)
Python函数编程
摘要:一 函数的介绍和基本使用 为什么要使用函数? 避免代码重用 提高代码的可读性 函数的定义与调用 def 函数名(参数1,参数2) ''' 函数注释''' print('函数体') return 返回值 定义:def关键字开头,空格之后接函数名和圆括号,最后还要加一个冒号。函数名:函数名是包含字母,数 阅读全文
posted @ 2019-09-27 10:16 cs_1993 阅读(272) 评论(0) 推荐(0)
数据分析核心包pandas
摘要:一 pandas简介 pandas是一个强大的Python数据分析的工具包, 是基于NumPy构建的 pandas的主要功能 具备对其功能的数据结构DateFrame Series 集成时间序列功能 提供丰富的数学运算和操作 灵活处理缺失数据 安装方法: pip install pandas 引用方 阅读全文
posted @ 2019-05-06 10:39 cs_1993 阅读(424) 评论(0) 推荐(0)
科学计算基础包--numpy
摘要:一 numpy的简介 NumPy是高性能科学计算和数据分析的基础包。它是pandas等其他各种工具的基础。 NumPy的主要功能: ndarray, 一个多维数据结构, 高新且节省空间 无需循环对数据进行快速运算的数学函数 线性代数 随机数生成和傅里叶变换功能 安装方法: pip install n 阅读全文
posted @ 2019-05-05 10:21 cs_1993 阅读(244) 评论(0) 推荐(0)
Python中使用RabbitMQ
摘要:一 RabbitMQ简介 RabbitMQ是一个在AMQP基础上完整的,可复用的企业消息系统。他遵循Mozilla Public License开源协议。 MQ全称为Message Queue, 消息队列(MQ)是一种应用程序对应用程序的通信方法。应用程序通过读写出入队列的消息(针对应用程序的数据) 阅读全文
posted @ 2019-02-14 10:12 cs_1993 阅读(366) 评论(0) 推荐(0)
Python中操作Redis
摘要:一 Rdis基本介绍 redis是一个key-value存储系统。它支持存储的value类型相对更多,包括string(字符串)、list(链表)、set(集合)、zset(sorted set --有序集合)和hash(哈希类型)。这些数据类型都支持push/pop、add/remove及取交集并 阅读全文
posted @ 2019-01-31 10:43 cs_1993 阅读(277) 评论(0) 推荐(0)
python之virtualenv
摘要:一 virtualenv简介 virtualenv 用来建立一个虚拟的python环境,一个专属于项目的python环境。用virtualenv 来保持一个干净的环境非常有用 在开发Python应用程序的时候,系统安装的Python3只有一个版本:3.4。所有第三方的包都会被pip安装到Python 阅读全文
posted @ 2019-01-07 10:25 cs_1993 阅读(230) 评论(0) 推荐(0)
Linux下Python2升级Python3
摘要:Linux下Python2的升级方法: # 注意如果需要ssl服务需要先编译安装ssl具体参考:https://blog.51cto.com/13544424/2149473 一、下载Python3安装包: 1、在线下载 wget https://www.python.org/ftp/python/ 阅读全文
posted @ 2018-10-24 17:51 cs_1993 阅读(874) 评论(0) 推荐(0)
Python之面向对象
摘要:一 面向对象编程介绍 OOP(Object Oriented Programing)编程是利用“类”和“对象”来创建各种模型来实现对真实世界的描述。面向对象可以使程序更加容易扩展和容易修改,使我们的开发效率变得更高。基于面向对象的程序可以使人更容易理解你的代码逻辑从而使团队开发变得更从容 面向对象中 阅读全文
posted @ 2018-07-29 22:16 cs_1993 阅读(285) 评论(0) 推荐(0)
WEB框架之Ajax
摘要:一 Ajax简介 1 Ajax的介绍 AJAX翻译成中文就是"异步Javascript和XML"。即使用JavaScript语言与服务器进行异步交互,传输的数据为XML(当然,传输数据不只是XML,现在更多使用json数据) 同步交互:客户端发出一个请求后,需要等待服务器结束后才能发出第二个请求 异 阅读全文
posted @ 2018-07-25 20:19 cs_1993 阅读(298) 评论(0) 推荐(0)
I/O模型
摘要:一 I/O模型介绍 什么是I/O 1 计算机CPU只能处理内存中的数据,而要将数据持久化就要将数据存储到硬盘中,由于硬盘的速度要慢的多,当数据从硬盘加载到内存中过程就称为一次磁盘I/O 2 还有一种情况是在socket编程中服务端遇到网络I/O会将会进入阻塞状态,直到从内核中返回到数据。这种情况就称 阅读全文
posted @ 2018-06-06 22:57 cs_1993 阅读(206) 评论(0) 推荐(0)
Python并发编程之协程
摘要:一 什么是协程 协程就是指在单个线程的情况下不断的切换执行任务以达到并发的效果,这样可以大大降低对系统资源的消耗. 需要强调的是: 1. python的线程属于内核级别的,即由操作系统控制调度(如单线程遇到io或执行时间过长就会被迫交出cpu执行权限,切换其他线程运行) 2. 单线程内开启协程,一旦 阅读全文
posted @ 2018-06-04 21:02 cs_1993 阅读(189) 评论(0) 推荐(0)
Python并发编程之多线程
摘要:本节内容 什么是线程 线程与进程的区别 开启线程的两种方式 Thread对象的其他属性或方法 守护线程 GIL全局解释器锁 死锁和递归锁 信号量 event 计时器 线程queue 一 什么是线程 线程相对于进程更为轻量级,当一个进程启动同时也会启动一个主线程,多线程就是指在一个进程下创建多个线程并 阅读全文
posted @ 2018-06-02 17:33 cs_1993 阅读(320) 评论(2) 推荐(0)
Python并发编程之多进程
摘要:本节内容 什么是进程 并发与并行 进程的创建 Python中创建进程的方式 Process的join用法 守护进程 互斥锁 队列实现进程间通信 进程池 concurrent.futures模块的线程池与进程池 一 什么进程 进程是当一个静态的程序启动之后称之为一个进程。而负责执行是CPU。 也就是说 阅读全文
posted @ 2018-05-24 14:52 cs_1993 阅读(231) 评论(0) 推荐(0)