python数据分析

.ndim 秩 就是轴的数目或者维度的数量
.shape ndarray对象的尺度,对于矩阵就是n行,m列
.size代表元素的个数 n*m的值
.dtype ndarray对象元素类型
.itemsize ndarray对象中每个元素的大小.以字节为单位

ndarray数组的创建方法
1 从python中的列表、元组等类型中创建nadarray数组
x=np.array(list/tuple)
x=np.array(list/tuple,dtype=np.float32)
当np.array()不指定dtype时,NumPy将根据数据情况关联一个dtype类型。
np.arange(n) 类似range()函数,返回ndarray类型,元素从0到n-1
np.ones(shape)根据生成一个全1的数组,shape是元组类型
shape=(4,4)代表生成一个4*4全1矩阵
np.zeros(shape)根据shape生成一个全0的数组,shape是元组类型
np.full(shape,val)根据shape生成一个数组,每个元素值都是val
np.eye(n)生成一个n*n的单位矩阵,对角线元素都是1,其余的都是0

np.ones_like(a)根据数组a的形状生成一个全1的数组
np.zeros_like(a)根据数组a的形状生成一个全0的数组
np.full_like(a,val)根据数组a的形状生成一个数组,每个值都是val

a=np.linespace(1,10,4)代表起始元素是1,终止元素是10,被分割成4个数
a=np.linespace(1,10,4,endpoint=False)代表最后一个数是不是作为元素放入,这样生成的数默认是浮点类型
np.concatenate((a,b))合并

a=np.reshape(shape)其中np的size是满足shape各个维度元素的乘积总和的
np.resize直接把np改变,不返回
b=np.swapaxes(0,1)直接交换第一维和第二维,维度默认从0开始
np.flatten()数组降成一维的

a=np.ones((2,3,4),dtype=np.int)
astype()
astype()方法一定会创建一个新的数组(原数据的一个拷贝),即使两个类型一致
ndarray()转列表
Is=a.tolist()数组向列表转换

ndarray索引和切片都是支持的
a[1:4:2]
启示元素1,1:4代表下标为1-3的元素,每次取的步长是2

多维数组索引和切片
a=np.arange(24).reshape((2,3,4))
访问使用逗号分割维度数,a[1,2,3]
多维数组切片
print(a[:,1,-3])
表示无视第一个维度,第二个维度下标是1,第三个维度下标是-3的元素
冒号选取维度,每个维度的切片方法和一维数组相同

np.mean()元素的平均值
np/np.mean()数组和标量之间的运算

np.abs(x) np.fabs(x)计算数组的各个元素之间的绝对值
np.sqrt()计算数组元素平方根
np.square()计算各个元素的平方
np.log(x)自然对数
np.log10(x)10为低对数
np.log2(x)2为底的对数
np.ceil(x) np.floor(x)向上向下取正
np.rint(x)计算数组各个元素的四舍五入的值
np.modf(x)将数组各个元素的小数和整数部分以两个独立数组的形式返回
np.cos(x) np.cosh(x)
np.sin(x) np.sinh(x)
np.tan(x) np.tanh(x)
np.exp(x)计算数组各个元素的指数值
np.sign(x)各个元素的符号值

 

NumPy的二元函数
np.maximum(x,y) np.fmax()元素的最大值最小值

数据CSV文件
生成CSV文件

np.savetxt(frame,array,fmt='%.18e',dekimiter=None)
frame:文件、字符串或产生器,可以是.gz或者.bz2的压缩文件
array:存入文件的数组。
fmt:写入文件的格式,列如:%d :2.f %.18e
delimiter:分割字符串,默认是任何空格
np.save(''a.csv',a,fmt='%d',delimiter=',')

np.load(frme,dtype=np.float,delimiter=None,impack=Flase)
frame:文件、字符串或产生器,可以是.gz.bz2的压缩文件
dtype:数据类型可选。
delimiter分割字符串,默认是任何空格
unpack:如果是Ture,读入的属性将分别写入不同的变量

不足CSV只能存取一维,和二维数据的存取
a.tofile(frame,sep='',format='%s')
frame:文件、字符串
sep:数据分割字符串、如果是空串、写入文件是二进制
format写入文件的数据格式

np.fromfile(frame,dtype=float,count=-1,sep='')
frame:文件,字符串
dtype:读取数据类型
count:读入元素的个数,-1表示读入整个文件
sep数据分割字符串、如果是空串,写入文件为二进制。

sum(a,axis=None)
根据给定轴axis计算数组a相关元素的和,axis整数或者元组

mean(a,axis=None)根据给定轴axis计算数组a的相关元素的期望,axis整数或者元组

average(a,axis=None,weights=None) 根据给定轴axus计算数组a相关元素的加权平均值

str(a,axis=None) 根据给定轴axis计算数组a相关元素标准差
var(a,axis=None)根据给定轴axis计算数组a相关元素的方差

min(a) max(a)计算数组a中元素的最小值和最大值
argmin(a) argmax(a)计算数组a中元素最小值和最大值将一维后的下标
unravel_index(index,shape)计算数组a中元素的最大值和最小值的差
ptp(a) 计算数组a中元素最大值和最小值的差
median(a)计算数组中的中位数

 

 

 

 

 

 

 

 

posted @ 2019-11-11 22:58  bluefly-hrbust  阅读(206)  评论(0编辑  收藏  举报