pandas切片使用和column赋值
摘要:#-*- coding: utf-8 -*- #对数据进行基本的探索 #返回缺失值个数以及最大最小值 import pandas as pd datafile= '../data/air_data.csv' #航空原始数据,第一行为属性标签 resultfile = '../tmp/explore.xls' #数据探索结果表 data = pd.read_csv(datafile, en...
阅读全文
reshape、shuffle、save_weights
摘要:#-*- coding: utf-8 -*- import pandas as pd from random import shuffle import matplotlib.pyplot as plt #导入Matplotlib datafile = '../data/model.xls' data = pd.read_excel(datafile) data = data.as_matr...
阅读全文
as_matrix、保存训练模型
摘要:#-*- coding: utf-8 -*- #构建并测试CART决策树模型 import pandas as pd #导入数据分析库 from random import shuffle #导入随机函数shuffle,用来打乱数据 import matplotlib.pyplot as plt #导入Matplotlib datafile = '../data/model.xls' #数据...
阅读全文
python拉格朗日插值
摘要:#拉格朗日插值代码 import pandas as pd #导入数据分析库Pandas from scipy.interpolate import lagrange #导入拉格朗日插值函数 inputfile = '../data/catering_sale.xls' #销量数据路径 outputfile = '../tmp/sales.xls' #输出数据路径 data = pd.rea...
阅读全文
array与List之间相互转化
摘要:#!/usr/bin/env python # -*- coding: utf-8 -*- # @Time : 2018/5/28 16:05 # @Author : zhang chao # @File : test.py import matplotlib.pyplot as plt import numpy as np alist=[1,2,3,4,5] print("Lis...
阅读全文
python逻辑回归 自动建模
摘要:#-*- coding: utf-8 -*- #逻辑回归 自动建模 import numpy as np import pandas as pd from sklearn.linear_model import LogisticRegression as LR from sklearn.linear_model import RandomizedLogisticRegression as RLR...
阅读全文
python主成分分析
摘要:#-*- coding: utf-8 -*- #主成分分析 降维 import pandas as pd #参数初始化 inputfile = '../data/principal_component.xls' outputfile = '../tmp/dimention.xls' #降维后的数据 data = pd.read_excel(inputfile, header = None) ...
阅读全文
matplotlib绘图pie
摘要:#!/usr/bin/env python # -*- coding: utf-8 -*- # @Time : 2018/5/28 16:05 # @Author : zhang chao # @File : test.py import matplotlib.pyplot as plt labels='Frogs','Hogs','Dogs','Logs'#定义标签 sizes=...
阅读全文
python数据相关性分析 (计算相关系数)
摘要:#-*- coding: utf-8 -*- #餐饮销量数据相关性分析 计算相关系数 from __future__ import print_function import pandas as pd catering_sale = '../data/catering_sale_all.xls' #餐饮数据,含有其他属性 data = pd.read_excel(catering_sale,...
阅读全文
python贡献度分析20/80定律
摘要:#-*- coding: utf-8 -*- #菜品盈利数据 帕累托图 from __future__ import print_function import pandas as pd #初始化参数 dish_profit = '../data/catering_dish_profit.xls' #餐饮菜品盈利数据 data = pd.read_excel(dish_profit, inde...
阅读全文
python数据统计量分析
摘要:#-*- coding: utf-8 -*- #餐饮销量数据统计量分析 from __future__ import print_function import pandas as pd catering_sale = '../data/catering_sale.xls' #餐饮数据 data = pd.read_excel(catering_sale, index_col = u'日期')...
阅读全文
python箱型图
摘要:#-*- coding: utf-8 -*- import pandas as pd catering_sale = '../data/catering_sale.xls' #餐饮数据 data = pd.read_excel(catering_sale, index_col = u'日期') #读取数据,指定“日期”列为索引列 import matplotlib.pyplot as plt...
阅读全文
pandas文件写入读取操作
摘要:#encoding:utf8 import pandas as pd import numpy as np from pylab import * df=pd.read_csv("./path")#CSV文件读取 df1=pd.read_excel("./path")#excel文件读取 df.to_csv("./path")#CSV文件写入 df1.to_excel("./path")#exc...
阅读全文
pandas绘图
摘要:#encoding:utf8 import pandas as pd import numpy as np import matplotlib.pyplot as plt df = pd.DataFrame(np.random.randn(10,4),index=pd.date_range('2018/12/18', periods=10), columns=list('ABCD')) p...
阅读全文
pandas创建一个日期
摘要:1、通过指定周期和频率,使用date.range()函数就可以创建日期序列。 默认情况下,范围的频率是天。 2、bdate_range()用来表示商业日期范围,不同于date_range(),它不包括星期六和星期天。’
阅读全文
pandas获取当前时间
摘要:datetime.now()用于获取当前的日期和时间 print pd.datetime.now()
阅读全文
pandas 级联 concat append
摘要:连接的一个有用的快捷方式是在Series和DataFrame实例的append方法。这些方法实际上早于concat()方法。 它们沿axis=0连接
阅读全文
pandas分组group
摘要:Pandas对象可以分成任何对象。有多种方式来拆分对象,如 - obj.groupby(‘key’) obj.groupby([‘key1’,’key2’]) obj.groupby(key,axis=1) 现在来看看如何将分组对象应用于DataFrame对象
阅读全文
pandas聚合aggregate
摘要:#!/usr/bin/env python # -*- coding: utf-8 -*- # @Time : 2018/5/24 15:03 # @Author : zhang chao # @File : s.py import pandas as pd import numpy as np df = pd.DataFrame(np.random.randn(10, 4), ...
阅读全文
pandas shift
摘要:#!/usr/bin/env python # -*- coding: utf-8 -*- # @Time : 2018/5/24 15:03 # @Author : zhang chao # @File : s.py import numpy as np import pandas as pd df = pd.DataFrame(np.arange(24).reshape(6,4...
阅读全文
pandas合并/连接
摘要:Pandas具有功能全面的高性能内存中连接操作,与SQL等关系数据库非常相似。Pandas提供了一个单独的merge()函数,作为DataFrame对象之间所有标准数据库连接操作的入口 - Python Python 在这里,有以下几个参数可以使用 - left - 一个DataFrame对象。 r
阅读全文
pandas缺失值处理
摘要:1、检查缺失值 为了更容易地检测缺失值(以及跨越不同的数组dtype),Pandas提供了isnull()和notnull()函数,它们也是Series和DataFrame对象的方法 - 2、清理/填充缺少 数据Pandas提供了各种方法来清除缺失的值。 fillna()函数可以通过几种方法用非空数
阅读全文
panda迭代
摘要:1、注意 - 不要尝试在迭代时修改任何对象。迭代是用于读取,迭代器返回原始对象(视图)的副本,因此更改将不会反映在原始对象上。 2、itertuples()方法将为DataFrame中的每一行返回一个产生一个命名元组的迭代器。元组的第一个元素将是行的相应索引值,而剩余的值是行值。 3、iterrow
阅读全文
pandas重新索引
摘要:#重新索引会更改DataFrame的行标签和列标签。重新索引意味着符合数据以匹配特定轴上的一组给定的标签。 #可以通过索引来实现多个操作 - #重新排序现有数据以匹配一组新的标签。 #在没有标签数据的标签位置插入缺失值(NA)标记。 #示例 import pandas as pd import numpy as np N=20 df = pd.DataFrame({ 'A': p...
阅读全文
pandas基本操作2
摘要:1、axes返回标签列表 2、empty示例,返回布尔值,表示对象是否为空。返回True则表示对象为空 print(df.empty) 3、
阅读全文
pandas.DataFrame
摘要:1、可以使用单个列表或列表列表创建数据帧(DataFrame)。 单个列表 列表列表 2、从ndarrays/Lists的字典来创建DataFrame 3、字典列表可作为输入数据传递以用来创建数据帧(DataFrame),字典键默认为列名。 4、从系列的字典来创建DataFrame
阅读全文
pandas设置值、更改值
摘要:#!/usr/bin/env python # -*- coding: utf-8 -*- # @Time : 2018/5/24 15:03 # @Author : zhang chao # @File : s.py from scipy import linalg as lg #按标签选择 #通过标签选择多轴 import pandas as pd import numpy ...
阅读全文
pandas取值
摘要:D:\Download\python3\python3.exe D:/Download/pycharmworkspace/s.pydf: A B C D2017-01-01 -1.353900 -0.737163 -0.266858 -0.2191162017-01-02 -2.328935 0.2
阅读全文
pandas 基本操作
摘要:1、通过传递numpy数组,使用datetime索引和标记列来创建DataFrame 2、通过传递可以转换为类似系列的对象的字典来创建DataFrame 3、 4、 5、描述显示数据的快速统计摘要 6、调换数据 行列转换 类似矩阵转置 7、通过轴排序 8、 9、 8、排序算法
阅读全文
Pandas三个数据结构
摘要:系列(Series) 数据帧(DataFrame) 面板(Panel) 这些数据结构构建在Numpy数组之上,这意味着它们很快。 考虑这些数据结构的最好方法是,较高维数据结构是其较低维数据结构的容器。 例如,DataFrame是Series的容器,Panel是DataFrame的容器。 构建和处理两
阅读全文
pandas.Series
摘要:1、系列(Series)是能够保存任何类型的数据(整数,字符串,浮点数,Python对象等)的一维标记数组。轴标签统称为索引。 Pandas系列可以使用以下构造函数创建 - 可以使用各种输入创建一个系列,如 数组、字典、标量值、或、常数 2、
阅读全文
scipy线性模块liner(linalg)
摘要:#liner import numpy as np from scipy import linalg as lg arr=np.array([[1,1],[0,1]]) matr=np.mat('[1,2;0,2]') print ("matrix:",matr)#matrix: [[1 2],[0 2]] print ("Det:",lg.det(arr))#array行列式 print ("...
阅读全文
numpy meshgrid函数
摘要:1、meshgrid函数用两个坐标轴上的点在平面上画格。 用法: [X,Y]=meshgrid(x,y) [X,Y]=meshgrid(x)与[X,Y]=meshgrid(x,x)是等同的 [X,Y,Z]=meshgrid(x,y,z)生成三维数组,可用来计算三变量的函数和绘制三维立体图 例如例题1
阅读全文
scipy插值interpolation
摘要:>>> from scipy.interpolate import interp1d#interp1d表示1维插值 >>> from scipy.interpolate import interp1d#interp1d表示1维插值 >>> >>> x = np.linspace(0, 10, num
阅读全文
scipy优化器optimizer
摘要:#optimazer优化器 from scipy.optimize import minimize def rosem(x): return sum(100.0*(x[1:]-x[:-1])**2.0+(1-x[:-1])**2.0) x0=np.array([1.3,.7,.8,1.9,1.2]) res=minimize(rosem,x0,method="nelder-mead",o...
阅读全文
scipy积分 integral
摘要:#!/usr/bin/env python # -*- coding: utf-8 -*- # @Time : 2018/5/24 15:03 # @Author : zhang chao # @File : s.py #integral积分 import numpy as np from scipy.integrate import quad,dblquad,nquad pri...
阅读全文
matplotlib绘图3
摘要:#scatter fig=plt.figure() ax=fig.add_subplot(3,3,1)#3行3列 第一个图 n=128 X=np.random.normal(0,1,n) Y=np.random.normal(0,1,n) T=np.arctan2(Y,X)#T用来上色的 #plt.
阅读全文
matplotlib绘图2
摘要:fig=plt.figure() fig.add_subplot(3,3,1)#3行3列 第一个图 n=128 X=np.random.normal(0,1,n) Y=np.random.normal(0,1,n) T=np.arctan2(Y,X)#T用来上色的 plt.axes([0.025,0.025,0.95,0.95])#显示的范围 plt.scatter(X,Y,s=75,c=T,a...
阅读全文
python matplotlib绘图
摘要:import numpy as np import matplotlib.pyplot as plt from scipy.constants.constants import alpha from matplotlib.patches import ArrowStyle x=np.linspace(-np.pi,np.pi,256,endpoint=True) #np.linspace定义横轴...
阅读全文
matplotlib绘图
摘要:fig = plt.figure() ax=plt.gca() timeList = np.array(timeList) timeList=timeList*100 timeList1 = np.array(timeList1) timeList1=timeList1*100 timeList2 = np.array(timeList2...
阅读全文
python装饰器
摘要:#func.__name__: now#I am Banner brother!
阅读全文
二叉排序树类的: C++ 实现
摘要:#include using namespace std; template struct TreeNode { T element; TreeNode*parent, *lnode, *rnode; TreeNode(){ parent = lnode = rnode = NULL; } TreeNode(const T& key) { ...
阅读全文
折半查找
摘要:#include /** * 折半查找函数 * * @param arr 数组 * @param len 数组长度 * @param value 查找元素 * * @return 返回查找元素的位置 */ int searchItem(int arr[],int len, int value){ int low = 0,high = len-1,mid...
阅读全文
最小生成树-Prim算法和Kruskal算法
摘要:Prim算法 1.概览 普里姆算法(Prim算法),图论中的一种算法,可在加权连通图里搜索最小生成树。意即由此算法搜索到的边子集所构成的树中,不但包括了连通图里的所有顶点(英语:Vertex (graph theory)),且其所有边的权值之和亦为最小。该算法于1930年由捷克数学家沃伊捷赫·亚尔尼
阅读全文
python排序
摘要:排序算法概览 归并排序的 空间复杂度为O(n) 插入排序 基本思想是每次讲一个待排序的记录,按其关键字大小插入到前面已拍好的子序列中,直到全部完成。 直接插入排序 讲元素L(i)插入到有序序列L[1,…,i-1]中,执行以下操作: 1. 查找出L(i)在L[1,…,i-1]中的插入位置k。 2. 将
阅读全文
python中常用的九种数据预处理方法分享
摘要:Spyder Ctrl + 4/5: 块注释/块反注释 本文总结的是我们大家在python中常见的数据预处理方法,以下通过sklearn的preprocessing模块来介绍; 1. 标准化(Standardization or Mean Removal and Variance Scaling)
阅读全文
BatchNormalization的使用
摘要:# import BatchNormalization from keras.layers.normalization import BatchNormalization # instantiate model model = Sequential() # we can think of this
阅读全文
python Thread、lock
摘要:Python的标准库提供了两个模块:_thread和threading,_thread是低级模块,threading是高级模块,对_thread进行了封装。绝大多数情况下,我们只需要使用threading这个高级模块。 启动一个线程就是把一个函数传入并创建Thread实例,然后调用start()开始
阅读全文
Python中使用正则表达式
摘要:字符串是编程时涉及到的最多的一种数据结构,对字符串进行操作的需求几乎无处不在。比如判断一个字符串是否是合法的Email地址,虽然可以编程提取@前后的子串,再分别判断是否是单词和域名,但这样做不但麻烦,而且代码难以复用。 正则表达式是一种用来匹配字符串的强有力的武器。它的设计思想是用一种描述性的语言来
阅读全文
python进程和线程
摘要:很多同学都听说过,现代操作系统比如Mac OS X,UNIX,Linux,Windows等,都是支持“多任务”的操作系统。 什么叫“多任务”呢?简单地说,就是操作系统可以同时运行多个任务。打个比方,你一边在用浏览器上网,一边在听MP3,一边在用Word赶作业,这就是多任务,至少同时有3个任务正在运行
阅读全文
python定制类
摘要:看到类似__slots__这种形如__xxx__的变量或者函数名就要注意,这些在Python中是有特殊用途的。 __slots__我们已经知道怎么用了,__len__()方法我们也知道是为了能让class作用于len()函数。 除此之外,Python的class中还有许多这样有特殊用途的函数,可以帮
阅读全文
python 描述符
摘要:Python中包含了许多内建的语言特性,它们使得代码简洁且易于理解。这些特性包括列表/集合/字典推导式,属性(property)、以及装饰器(decorator)。对于大部分特性来说,这些“中级”的语言特性有着完善的文档,并且易于学习。 但是这里有个例外,那就是描述符。至少对于我来说,描述符是Pyt
阅读全文
python @property
摘要:在绑定属性时,如果我们直接把属性暴露出去,虽然写起来很简单,但是,没办法检查参数,导致可以把成绩随便改: 这显然不合逻辑。为了限制score的范围,可以通过一个set_score()方法来设置成绩,再通过一个get_score()来获取成绩,这样,在set_score()方法里,就可以检查参数: 现
阅读全文
python slots
摘要:正常情况下,当我们定义了一个class,创建了一个class的实例后,我们可以给该实例绑定任何属性和方法,这就是动态语言的灵活性。先定义class: 然后,尝试给实例绑定一个属性: 还可以尝试给实例绑定一个方法: 但是,给一个实例绑定的方法,对另一个实例是不起作用的: 为了给所有实例都绑定方法,可以
阅读全文
python 授权
摘要:1.“包装”意思是一个已经存在的对象进行包装,不管他是数据类型还是一段代码,可以是对一个已经存在的对象增加新的,删除不要的或者修改其他已经存在的功能 2.包装 包括定义一个类,他的实例拥有标准类型的核心行为,换句话说,他现在不仅能唱能跳,还能像原类型一样步行。 这个图片说明了在类中包装的类型看起来像
阅读全文
python下划线
摘要:单下划线(_) 通常情况下,会在以下3种场景中使用: 1、在解释器中:在这种情况下,“_”代表交互式解释器会话中上一条执行的语句的结果。这种用法首先被标准CPython解释器采用,然后其他类型的解释器也先后采用。 Python 1 2 3 4 5 6 7 8 9 10 >>> _ Traceback
阅读全文
Python getattr() 函数
摘要:描述 getattr() 函数用于返回一个对象属性值。 语法 getattr 语法: 参数 object -- 对象。 name -- 字符串,对象属性。 default -- 默认返回值,如果不提供该参数,在没有对应属性时,将触发 AttributeError。 返回值 返回对象属性值。 实例 以
阅读全文
python中的__init__和__new__的区别
摘要:一、__init__ 方法是什么?(init前后的线是双下划线) 使用Python写过面向对象的代码的同学,可能对 __init__ 方法已经非常熟悉了,__init__ 方法通常用在初始化一个类实例的时候。例如: 这样便是__init__最普通的用法了。但__init__其实不是实例化一个类的时候
阅读全文
偏函数
摘要:Python的functools模块提供了很多有用的功能,其中一个就是偏函数(Partial function)。要注意,这里的偏函数和数学意义上的偏函数不一样。 在介绍函数参数的时候,我们讲到,通过设定参数的默认值,可以降低函数调用的难度。而偏函数也可以做到这一点。举例如下: int()函数可以把
阅读全文
python 闭包
摘要:闭包: 在一个外函数中定义了一个内函数,内函数里运用了外函数的临时变量,并且外函数的返回值是内函数的引用。这样就构成了一个闭包。 一般情况下,在我们认知当中,如果一个函数结束,函数的内部所有东西都会释放掉,还给内存,局部变量都会消失。但是闭包是一种特殊情况,如果外函数在结束的时候发现有自己的临时变量
阅读全文
python assert的作用
摘要:python assert的作用 一、python assert的作用: 根据Python 官方文档解释(https://docs.python.org/3/reference/simple_stmts.html#assert), "Assert statements are a convenien
阅读全文
python raise
摘要:当程序出现错误,python会自动引发异常,也可以通过raise显示地引发异常。一旦执行了raise语句,raise后面的语句将不能执行。 演示raise用法 try: s = None if s is None: print "s 是空对象" raise NameError #如果引发NameEr
阅读全文