随笔分类 - python
摘要:一、什么是聚类算法? 1、用于发现共同的群体(cluster),比如:邮件聚类、用户聚类、图片边缘。 2、聚类唯一会使用到的信息是:样本与样本之间的相似度(跟距离负相关) 给定N个训练样本(未标记的){x 1 , . . . , x N },同时给定结果聚类的个数K 目标:把比较“接近”的样本放到一
阅读全文
摘要:安装 pip install xlwt 快速开始 import xlwt # 创建一个workbook 设置编码 workbook = xlwt.Workbook(encoding = 'utf-8') # 创建一个worksheet worksheet = workbook.add_sheet('
阅读全文
摘要:使用python操作excel python操作excel主要用到xlrd和xlwt这两个库,即xlrd是读excel,xlwt是写excel的库。 安装xlrd模块 #pip install xlrd 使用介绍 常用单元格中的数据类型 empty(空的) string(text) number d
阅读全文
摘要:一、什么是逻辑回归? 逻辑回归又称对数几率回归是离散选择法模型之一,逻辑回归是一种用于解决监督学习问题的学习算法,进行逻辑回归的目的是使训练数据的标签值与预测出来的值之间的误差最小化。logistic回归的因变量可以是二分类的,也可以是多分类的,但是二分类的更为常用,也更加容易解释,多类可以使用so
阅读全文
摘要:一、朴素贝叶斯 首先第一个问题,什么是朴素贝叶斯? 贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。而朴素朴素贝叶斯分类是贝叶斯分类中最简单,也是常见的一种分类方法。而我们所想要实现的留言过滤其实是一种分类行为,是通过对于概率的判断,来对样本进行一个归类的过程。 朴
阅读全文
摘要:进程、线程的含义? 1.什么是进程? 进程是指运行中的应用程序,每个进程都有自己独立的地址空间(内存空间)。比如用户点击桌面的IE浏览器,就启动了一个进程,操作系统就会为该进程分配独立的地址空间。当用户再次点击IE浏览器,又启动了一个进程,操作系统将为新的进程分配新的独立的地址空间。多进程就是“多任
阅读全文
摘要:在Python 3.5(含)以前,字典是不能保证顺序的,键值对A先插入字典,键值对B后插入字典,但是当你打印字典的Keys列表时,你会发现B可能在A的前面。 但是从Python 3.6开始,字典是变成有顺序的了。你先插入键值对A,后插入键值对B,那么当你打印Keys列表的时候,你就会发现B在A的后面
阅读全文
摘要:官方文档:http://superset.apache.org/ 一、环境准备 安装python3即3.4以上版本 二、python创建一个虚拟环境用来作为superset的容器 创建虚拟环境: -(1)virtualenv env_supersetobj(创建虚拟环境) -(2)virtualen
阅读全文
摘要:获取tzinfo的的Arrow对象。 >>> arw=arrow.utcnow() >>> arw.tzinfo tzutc() >>> arw=arrow.utcnow() >>> arw.tzinfo tzutc() 返回Arrow对象的日期时间表示形式。 >>> arw=arrow.utcno
阅读全文
摘要:一、正则表达式的语法 正则表达式使用反斜杠字符('\')来表示特殊的形式或者来允许使用特殊的字符而不要启用它们特殊的含义。这与字符串字面值中相同目的的相同字符的用法冲突;例如,要匹配一个反斜线字面值,你必须写成'\\\\'作为模式字符串,因为正则表达式必须是\\,每个反斜线在Python字符串字面值
阅读全文
摘要:GIL:全局解释器锁 GIL设计理念与限制: python的代码执行由python虚拟机(也叫解释器主循环,CPython版本)来控制,python在设计之初就考虑到在解释器的主循环中,同时只有一个线程在运行。即在任意时刻只有一个线程在解释器中运行。对python虚拟机访问的控制由全局解释锁GIL控
阅读全文
摘要:set集合和dict字典的区别 唯一区别: 相同点: set集合和list列表的区别相同点: 不同点: set集合主要用于测试数据和数据的交、并、差等此类型的和去重操作set集合本质区别和dict字典相同 list列表和dict字典的区别相同点: 不同点: tuple元组和list列表的区别不同点:
阅读全文
摘要:1、什么是中间件? 中间件是介于request与response处理之间的一道处理过程,相对比较轻量级,并且在全局上改变django的输入与输出。 中间件一般做认证或批量请求处理,django中的中间件,其实是一个类,在请求和结束后,django会根据自己的规则在合适的时机执行中间件中相应的方法。
阅读全文
摘要:基础概念 首先要了解 WSGI 规范的概念,WSGI(Web Server Gateway Interface)规范描述了web server(Gunicorn,uWSGI等)如何与web application(flask, django等)交互、web application如何处理请求,定义在
阅读全文
摘要:一、ORM简介 对象关系映射(Object Relational Mapping,简称ORM)模式是一种为了解决面向对象与关系数据库存在的互不匹配的现象的技术。简单的说,ORM是通过使用描述对象和数据库之间映射的元数据,将程序中的对象自动持久化到关系数据库中。那么,到底如何实现持久化呢?一种简单的方
阅读全文
摘要:一:渲染模版 要渲染一个模板,通过render_template方法即可。 @app.route('/about/') def about(): # return render_template('about.html',user='username') return render_template
阅读全文
摘要:urllib 是 Python 标准库中用于网络请求的库。该库有四个模块,分别是urllib.request,urllib.error,urllib.parse,urllib.robotparser。 1 发起请求 模拟浏览器发起一个 HTTP 请求,我们需要用到 urllib.request 模块
阅读全文
摘要:pillow是Python平台事实上的图像处理标准库。PIL功能非常强大,但API却非常简单易用。 所以我们使用它在环境里做图像的处理。 第一步 下载pillow 第二部 编写代码 1>创建一个类,初始化并为类添加属性 我们可能需要的属性有:验证码图片宽高,干扰点线数量,我们要出现多少个验证码等 2
阅读全文
摘要:Python中操作mysql的pymysql模块详解 前言 pymsql是Python中操作MySQL的模块,pymysql支持python3.x。 一、安装 pip install pymysql 二、使用操作 1、执行SQL #!/usr/bin/env pytho # -*- coding:u
阅读全文
摘要:正则: 概念:描述或匹配一系列符合某种规则的字符串 作用:数据验证 内容检索 内容替换 内容过滤 //创建正则对象 //通过实例化对象 letreg=newRegExp("正则表达式"+变量,"模式修正符") 模式修正符:g:global全局(下一次执行从上一次之后位置) i:不区分大小写m:可以换
阅读全文

浙公网安备 33010602011771号