Numpy基础学习

什么是Numpy

Numpy是Python的一个科学计算库,提供了矩阵运算的功能,通常与scipy和matplotlib一起使用,用来替代matlab.

Ndarray对象

Ndarray是Numpy中定义的最重要的一个对象,它描述了相同类型的“items”的集合. 可以使用例如整数的N来索引项目中的items.

Ndarray中的每个项在内存中使用相同大小的块,并且Ndarray中每个块都是以完全相同的方式(即相同的数据类型对象data-type)进行解释的.而解释数组中的每个项的数据类型对象是单独存放的.

从数组中提取的项则是由类型为阵列标量的python对象表示的,

Ndarray的基本创建

numpy.array(object, dtype = None, copy = True, order = None, subok = False, ndmin = 0)

参数	描述
object	任何暴露数组接口方法的对象都会返回一个数组或任何(嵌套)序列
dtype	数组的所需数据类型,可选
copy	对象是否被复制,默认为true,可选
order	C(按行), F(按列), A(任意,默认)
subok	默认情况下,返回的数组被强制为基类数组,如果为true,则返回子类
ndmin	指定返回数组的最小维数

接下来我们看几个例子

>>> a = np.array([1,2,3])
>>> print(a)

[1 2 3]

>>> a = np.array([[1,2], [3,4]])
>>> print(a)

[[1 2]
[3 4]]

>>> a = np.array([1,2,3], dtype = complex)
>>> print(a)

[1.+0.j 2.+0.j 3.+0.j]

>>> a = np.array([1,2,3,4,5], ndmin = 3)
>>> print(a)

[[[1 2 3 4 5]]]

numpy的数据类型

Numpy支持比python更多的数字类型,这里显示的是哪些是可用的,以及如何修改数组的数据类型.

数据类型	描述
bool_	布尔(True或False),存储为一个字节
int_	默认整数类型(与C中的long相同;通常是int64或int32)
intc	与C中int相同(通常为int32或int64)
intp	用于索引的整数(与C中ssize_t相同；通常是int32或int64)
int8	字节(-128至127)
int16	整数(-32768至32767)
int32	整数(-2147483648至2147483647)
int64	整数(-9223372036854775808至9223372036854775807
uint8	无符号整数(0到255)
uint16	无符号整数(0到65535)
uint32	无符号整数(0到4294967295)
uint64	无符号整数(0到18446744073709551615)
float_	float64的简写
float16	半精度浮点:符号位,5位指数,10位尾数
float32	单精度浮点数:符号位,8位指数,23位尾数
float64	双精度浮点:符号位,11位指数,52位尾数
complex_	complex128的简写
complex64	复数,由两个32位浮点数(实部和虚部)
complex128	复数,由两个64位浮点数(实部和虚部)

Numpy数值类型是dtype(data-type)对象的实例,每个类型都具有唯一的特征.这些类型可以通过np.bool_, np.float32等方式来访问.
注:int8,int16,int32,int64可以替换成等价的字符串'i1','i2','i4','i8'.

数据类型对象(dtype)

数据类型对象描述了对应于数组的固定内存块的解释,取决与以下方面:
1.数据类型
2.数据大小
3.字节序(大端或者小端)
dtype的构造:

numpy.dtype(object, align, copy)

参数	描述
object	被转换为数据类型的对象
align	为True时向字段中添加间隔,使它类似C的结构体
copy	为True时生成dtype对象的新副本,为False时,为该数据类型对象的引用

示例:

>>> dt = np.dtype(np.int32)
>>> print(dt)

int32

>>> dt = np.dtype(np.'i4')
>>> print(dt)

int32

>>> dt = np.dtype('>i4')
>>> print(dt)

i4

>>> dt = np.dtype([('age', np.int8)])
>>> print(dt)

[('age', 'i1')]

>>> dt = np.dtype([('age', np.int8)])
>>> a = np.array([(10,),(20,),(30,)], dtype = dt)
>>> print(a)

[(10,) (20,) (30,)]

>>> dt = np.dtype([('age', np.int8)])
>>> a = np.array([(10,),(20,),(30,)], dtype = dt)
>>> print(a['age'])

[10 20 30]

>>> student = np.dtype([('name', 'S20'), ('age', 'i1'), ('marks', 'f4')])
>>> print(student)

[('name', 'S20'), ('age', 'i1'), ('marks', '<f4')]

>>> student = np.dtype([('name', 'S20'), ('age', 'i1'), ('marks', 'f4')])
>>> a = np.array([('tom', 21, 50), ('alice', 18, 86)], dtype = student)
>>> print(a)

[(b'tom', 21, 50.) (b'alice', 18, 86.)]

每个内置类型都有一个与它对应的字符码:

字符码	内置类型
'b'	布尔值
'i'	符号整数
'u'	无符号整数
'f'	浮点数
'c'	复数浮点
'm'	时间间隔
'M'	日期时间
'O'	python对象
'S', 'a'	字符串
'U'	Unicode
'V'	原始数据(void)

Numpy数组属性

这里我们会介绍numpy的多种数组属性.

ndarray.shape

这一数组属性返回一个包含数组维度的元组,它也可以用于调整数组大小.
示例:

>>> a = np.array([(1,2,3), (4,5,6)])
>>> print(a.shape)

(2, 3)

>>> a = np.array([(1,2,3), (4,5,6)])
>>> a.shape = (3,2)
>>> print(a)

[[1 2]
[3 4]
[5 6]]

这里,reshape()同样可以实现该功能

>>> a = np.array([(1,2,3), (4,5,6)])
>>> b = a.reshape(3,2)
>>> print(b)

[[1 2]
[3 4]
[5 6]]

ndarray.ndim

这一数组属性返回数组的维数
示例:

>>> a = np.arange(12)
>>> print(a)

[0 1 2 3 4 5 6 7 8 9 10 11]

>>> a = np.arange(12)
>>> print(a.ndim)

1

>>> a = np.arange(12)
>>> b = a.reshape(2,3,2)
>>> print(b)

[[[ 0 1]
[ 2 3]
[ 4 5]]

[[ 6 7]
[ 8 9]
[10 11]]]

numpy.itemsize

该数组属性返回数组中每一个元素的字节单位长度
示例:

>>> x = np.array([1,2,3,4,5], dtype = np.int8)
>>> print(x.itemsize)

1

>>> x = np.array([1,2,3,4,5], dtype = np.float32)
>>> print(x.itemsize)

4

numpy.flags

它会返回当前对象的以下所有属性

属性	描述
C_CONTIGUOUS (C)	数组位于单一的,C风格的连续区段内
F_CONTIGUOUS (F)	数组位于单一的,Fortran风格的连续区段内
OWNDATA (O)	数组的内存从其它对象处借用
WRITEABLE (W)	数据区域可写入,将它设置为false会锁定数据,使其为只读
ALIGNED (A)	数据和任何元素会为硬件适当对齐
UPDATEIFCOPY (U)	这个数组是另一个数组的副本,当这个数组释放时,源数组会由这个数组中的元素更新

示例:

>>> x = np.array([1,2,3,4,5])
>>> print(x.flags)

C_CONTIGUOUS : True
F_CONTIGUOUS : True
OWNDATA : True
WRITEABLE : True
ALIGNED : True
WRITEBACKIFCOPY : False
UPDATEIFCOPY : False

Numpy数组创建例程

新的ndarray对象可以通过如下方法或用低级的ndarray构造函数构造.

numpy.empty

它创建指定形状和dtype的未初始化数组.它使用如下的构造函数:

numpy.empty(shape, dtype, order)

它的参数解释如下:

参数	描述
shape	空数组的形状,整数或着元组
dtype	所需的输出数组类型,可选
order	'C'为按行的C风格数组, 'F'为按列的Fortran风格数组

示例:

>>> x = np.empty([3,2], dtype = int)
>>> print(x)

[[139780398185496 139780398179960]
[139780398199304 139780398165808]
[139780398165880 139780398199368]]

这里数组元素为随机值,因为未初始化

numpy.zeros

和numpy.empty类似,创建指定大小的数组,但是以0填充数组

numpy.zeros(shape, dtype, order)

构造器的参数及描述如下:

参数	描述
shape	空数组的形状,整数或元组
dtype	所需的输出数组类型,可选
order	'C'为按行的C风格数组, 'F'为按列的Fortran风格数组

实例:

>>> x = np.zeros(5)
>>> print(x)

[0. 0. 0. 0. 0.]

>>> x = np.zeros((5,), dtype = np.int)
>>> print(x)

[0 0 0 0 0]

>>> x = np.zeros((2,2), dtype = [('x', 'i4'), ('y', 'i4')])
>>> print(x)

[[(0, 0) (0, 0)]
[(0, 0) (0, 0)]]

numpy.ones

同上,创建指定大小数组,以1填充

numpy.ones(shape, dtype, order)

参数及描述:

参数	描述
shape	空数组的形状,整数或元组
dtype	所需的输出数组类型,可选
order	'C'为按行的C风格数组, 'F'为按列的Fortran风格数组

示例:

>>> x = np.ones([2,2], dtype = int)
>>> print(x)

[[1 1]
[1 1]]

numpy 以现有数据创建数组

numpy.asarray

此函数类似于numpy.array,除了有较少的参数.此例程对于将python序列转换成ndarray很有帮助.

numpy.asarray(a, dtype, order)

参数即描述:

参数	描述
a	任意形式输入参数,如列表,元组,或者相互嵌套等
dtype	会应用到返回的ndarray
order	'C'为按行的C风格数组, 'F'为按列的Fortran风格数组

示例:

>>> x = [1,2,3]
>>> a = np.asarray(x)
>>> print(a)

[1 2 3]

>>> x = [1,2,3]
>>> a = np.asarray(x,dtype = float)
>>> print(a)

[1. 2. 3.]

numpy.frombuffer(不常用)

此函数将缓冲区解释为一维数组,暴露缓冲区接口的任何对象都可用做参数来返回ndarray

numpy.frombuffer(buffer,dtype,count,offset)

参数及描述:

参数	描述
buffer	任何暴露缓冲区接口的对象
dtype	任何返回数组的数据类型,默认为float
count	需要读取的数据数量,默认为-1,即读取所有数据
offset	需要读取的起始位置,默认为0

示例:

>>> s = b'hello world'
>>> a = np.frombuffer(s, dtype = 'S1')
>>> print(a)

[b'h' b'e' b'l' b'l' b'o' b' ' b'w' b'o' b'r' b'l' b'd']

这里python3中默认字符串是Unicode的,所以前面要加个b转成bytestrings,其实这个方法平常也不怎么用,就不必在这里死扣细节.

numpy.fromiter

此方法可从迭代对象构建一个ndarray对象,并返回一个新的一维数组

numpy.fromiter(iterable, dtype, count)

参数即描述:

参数	描述
iterable	任何可迭代的对象
dtype	返回数组的数据类型
count	需要读取的数据量,默认为-1,即读取所有数据

示例:

>>> list = range(5)
>>> it = iter(list)
>>> x = np.fromiter(it, dtype = float)
>>> print(x)

[0. 1. 2. 3. 4.]

Numpy来自数值范围的数组

这里将会介绍如何从数值范围创建数组

numpy.arange

该方法返回ndarray对象,包含给定范围内的等间隔的值

numpy.arange(start,stop,step,dtype)

参数及解释:

参数	描述
start	范围的起始值,默认为0
stop	范围的终止值,必须包含
step	两个值间的间隔,即步长,默认为1
dtype	返回ndarray的数据类型,默认为输入数据的类型

示例:

>>> x = np.arange(5,10,2,dtype = float)
>>> print(x)

[5. 7. 9.]

numpy.linspace

此方法类似numpy.arange,但是是指定数组中元素的数量而非步长

numpy.linspace(start,stop,num,endpoint,retstep,dtype)

参数及描述:

参数	描述
start	序列的起始值
stop	序列的终止值,endpoint为true则是闭区间,否则为开区间
num	要生成的数组元素数量
endpoint	序列是否包含end,即右区间是开是闭,默认为true
retstep	若为true,返回样例和步长组成的元组
dtype	返回的ndarray的数据类型

示例:

>>> x = np.linspace(10,20,5,endpoint = False)
>>> print(x)

[10. 12. 14. 16. 18.]

>>> x = np.linspace(1,2,5,retstep = True)
>>> print(x)

(array([1. , 1.25, 1.5 , 1.75, 2. ]), 0.25)

Numpy的切片和索引

ndarray对象的内容也可以通过索引和切片来访问和修改.

基本索引和切片:

基本切片是python中基本切片概念扩展到n维,通过向slice函数提供参start,stop,step来构造一个python的slice对象,此slice对象再传递给数组来提取数组的一部分.

示例:

>>> a = np.arange(10)
>>> s = slice(2,7,2)
>>> print(a[s])

[2 4 6]

这里还有一种更为方便的切片方法:
即直接将切片参数以start:stop:step的形式直接提供给ndarray对象;其中参数也可部分省略;

示例:

>>> a = np.arange(10)
>>> b = a[5]
>>> print(b)

5

>>> a = np.arange(10)
>>> b = a[2:]
>>> print(b)

[2 3 4 5 6 7 8 9]

>>> a = np.arange(10)
>>> b = a[2:7:2]
>>> print(b)

[2 4 6]

上述方法对多维的ndarray也同样适用,

示例:

>>> a = np.array([[1,2,3], [4,5,6], [7,8,9]])
>>> b = a[1:]
>>> print(b)

[[4 5 6]
[7 8 9]]

>>> a = np.array([[1,2,3], [4,5,6], [7,8,9]])
>>> b = a[1,...]
>>> print(b)

[4 5 6]

>>> a = np.array([[1,2,3], [4,5,6], [7,8,9]])
>>> b = a[...,1]
>>> print(b)

[2 5 8]

>>> a = np.array([[1,2,3], [4,5,6], [7,8,9]])
>>> b = a[...,1:]
>>> print(b)

[[2 3]
[5 6]
[8 9]]

高级索引和切片

高级索引始终返回数据的副本,切片则只提供了一个视图
高级索引分为两种:整数和布尔

整数索引

这种机制有助于基于n维索引来获取数组中的任意元素,每个整数数组表示该维度下的对应下标值.

示例:

>>> x = np.array([[1,2], [3,4], [5,6]])
>>> y = x[[0,1,2],[0,1,0]]
>>> print(y)

[1 4 5]

这里分别获取了二维数组中的(0,0),(1,1),(2,0)这三个元素

>>> x = np.array([[0,1,2],[3,4,5],[6,7,8],[9,10,11]])
>>> rows = np.array([[0,0],[3,3]])
>>> cols = np.array([[0,2],[0,2]])
>>> y = x[rows,cols]
>>> print(y)

[[ 0 2]
[ 9 11]]

和之前的那个的区别就是那个只能创建一维的数组,而这里创建了二维数组,其实我觉得这里不太好理解.可以这样看:rows中第i个子数组和cols中第i个子数组中数字对应组成结果中第i行的元素,即一个子数组中的元素个数作为一共有列,然后rows或cols中一共多少个子数组就一共有多少行.
接下来是一些其他示例:

>>> x = np.array([[0,1,2],[3,4,5],[6,7,8],[9,10,11]])
>>> y = x[1:4,1:3]
>>> print(y)

[[ 4 5]
[ 7 8]
[10 11]]

>>> x = np.array([[0,1,2],[3,4,5],[6,7,8],[9,10,11]])
>>> y = x[1:4,[1,2]]
>>> print(y)

[[ 4 5]
[ 7 8]
[10 11]]

布尔索引

当结果对象是布尔运算的结果时,将使用此类型的高级索引.
示例:

>>> x = np.array([[0,1,2],[3,4,5],[6,7,8],[9,10,11]])
>>> y = x[x>5]
>>> print(y)

[ 6 7 8 9 10 11]

>>> a = np.array([1, 2+6j, 5, 5+5j])
>>> b = a[np.iscomplex(a)]
>>> print(b)

[2.+6.j 5.+5.j]

Numpy广播

术语广播指的是Numpy在算数运算期间处理不同形状数组的能力.数组的算数运算通常是对在相对应位置上的元素进行的.如果两个数组有着完全相同的形状,则这些操作可以无缝地执行.

示例:

>>> a = np.array([1,2,3,4])
>>> b = np.array([4,3,2,1])
>>> c = a * b
>>> print(c)

[4 6 6 4]

这个例子中两个数组有着相同的形状,所以对其进行操作完全没问题.
那么如果两个数组维数不同时怎么办呢?
这里就用到了Numpy的广播功能,即将较小的数组广播到较大的数组的大小,以使他们的形状可兼容.

示例:

>>> a = np.array([[1,2],[3,4],[5,6]])
>>> b = np.array([2,2])
>>> c = a + b
>>> print(c)

[[3 4]
[5 6]
[7 8]]

Numpy数组上的迭代

Numpy 包中含有一个迭代器对象numpy.nditer。它是一个多维迭代器对象，可以在数组上进行迭代。

基本迭代操作

示例:

>>> a = np.arange(0,60,5)
>>> a = a.reshape(3,4)
>>> for x in np.nditer(a):
...     print(x, end=" ")
...

0 5 10 15 20 25 30 35 40 45 50 55

迭代的顺序匹配数组的内容布局,而不考虑特定的排序.这里你只要知道数组转置过后的迭代结果任和原来相同.

>>> a = np.arange(0,60,5)
>>> a = a.reshape(3,4)
>>> b = a.T
>>> for x in np.nditer(b):
...     print(x, end = " ")
...

0 5 10 15 20 25 30 35 40 45 50 55

这里默认的输出是按C风格的,即一行一行地迭代,若改成F风格的话,则会一列一列地迭代:

>>> a = np.arange(0,60,5)
>>> a = a.reshape(3,4)
>>> b = a.copy(order="F")
>>> for x in np.nditer(b):
...     print(x, end = " ")
...

0 20 40 5 25 45 10 30 50 15 35 55

换一种方法

>>> a = np.arange(0,60,5)
>>> a = a.reshape(3,4)
>>> for x in np.nditer(a, order = "F"):
...     print(x, end = " ")
...

0 20 40 5 25 45 10 30 50 15 35 55

迭代器修改数组中的值

nditer对象有另一个可选参数op_flags.它的默认值为只读,但也可设置为读写或只写模式,这样便能使用迭代器来对数组中的元素进行修改.
示例:

>>> a = np.arange(0,60,5)
>>> a = a.reshape(3,4)
>>> for x in np.nditer(a, op_flags=['readwrite']):
...     x*=2
... 
>>> print(a)

[[ 0 10 20 30]
[ 40 50 60 70]
[ 80 90 100 110]]

外部循环

nditer类的构造器拥有flags参数,它可接受如下参数:

参数	描述
c_index	可以跟踪C顺序的索引
f_index
multi-index	每次迭代可以跟踪一种索引类型
external_loo	给出的值是具有多个元素的一维数组,而非多个元素
这里记下示例就好,等真正用到时在去查,
示例:

>>> a = np.arange(0,60,5)
>>> a = a.reshape(3,4)
>>> for x in np.nditer(a, flags = ['external_loop'], order = "F"):
...     print(x)
...

[ 0 20 40]
[ 5 25 45]
[10 30 50]
[15 35 55]

之前只设置order="F"时,输出的是一维数组,而这里输出的是二维数组,差别也就在于此

广播迭代

若两个数组是可广播的,则nditer组合对象可以同时迭代它们.
示例:

>>> a = np.arange(0,60,5)
>>> a = a.reshape(3,4)
>>> b = np.array([1,2,3,4], dtype = int)
>>> for x,y in np.nditer([a,b]):
...     print("%d:%d " % (x,y))
...

0:1
5:2
10:3
15:4
20:1
25:2
30:3
35:4
40:1
45:2
50:3
55:4

Numpy 数组操作

Numpy包中含有多个用于ndarray对象中元素的方法,大致可分为如下几种:

修改形状

方法	描述
reshape	不改变数据的条件下修改形状
flat	数组上的一维迭代器
flatten	返回折叠为一维的数组的副本
ravel	返回连续展开的数组

现在来具体看看这四种方法:

numpy.reshape

这个在刚开始讲shape时其实提到过一点了,它是在不改变数据的条件下修改数组的形状.

numpy.reshape(a, newshape, order)

参数	描述
a	要改变形状的数组
newshape	整数或者整数数组,新的形状应该兼容原有的形状
order	'C'为C风格顺序,'F'为F风格顺序,'A'为保留原顺序

示例:

>>> a = np.arange(8)
>>> b = a.reshape(4,2)
>>> print(a)
[0 1 2 3 4 5 6 7]
>>> print(b)

[[0 1]
[2 3]
[4 5]
[6 7]]

numpy.ndarray.flat

该函数返回数组上的一维迭代器,行为类似于python内部的迭代器.

>>> a = np.arange(8)
>>> b = a.reshape(2,4)
>>> c = b.flat[5]
>>> print(c)

5

numpy.ndarray.faltten

该函数返回折叠为一维的数组副本.

ndarray.flatten(order)

参数	描述
order	'C'按行, 'F'按列, 'A'按原顺序, 'k'元素在内存中出现的顺序

示例:

>>> a = np.arange(8)
>>> a = a.reshape(2,4)
>>> b = a.flatten()
>>> print(b)

[0 1 2 3 4 5 6 7]

numpy.ravel

此函数返回一个展开的一维数组,并按需生成副本.返回的数组和输入的数组拥有相同的数据类型.

numpy.ravel(a, order)

参数	描述
a	输入数组
order	'C'按行, 'F'按列, 'A'按原顺序, 'k'按元素在内存中的顺序

示例:

>>> a = np.arange(8).reshape(2,4)
>>> b = a.ravel()
>>> print(b)

[0 1 2 3 4 5 6 7]

###翻转操作

方法	描述
transpose	翻转数组的维度
ndarray.T	转置,和self.transpose相同
rollaxis	向后滚动指定的轴
swapaxes	互换两个数组的两个轴

numpy.transpose

这个函数翻转给给定数组的维度,如果可以的话它会返回一个视图.

numpy.transpose(a, axes)

参数	描述
a	要转置的数组
axes	整数的列表,对应维度,通常所有的维度都会反转

示例:

>>> a = np.arange(12).reshape(3,4)
>>> np.transpose(a)

array([[ 0, 4, 8],
[ 1, 5, 9],
[ 2, 6, 10],
[ 3, 7, 11]])

numpy.ndarray.T

该类属于ndarray类,行为类似于numpy.transpose
示例:

>>> a = np.arange(12).reshape(3,4)
>>> a.T

array([[ 0, 4, 8],
[ 1, 5, 9],
[ 2, 6, 10],
[ 3, 7, 11]])

numpy.rollaxis

该函数使数组向后滚动,直到一个特定的位置.

numpy.rollaxis(a, axis, start)

参数	描述
a	输入数组
axis	要向后滚动的轴,其他轴的相对位置不会改变
start	默认为0,表示完整的滚动,会滚动到特定的位置

示例:

>>> a = np.arange(8).reshape(2,2,2)
>>> np.rollaxis(a,2)

array([[[0, 2],
[4, 6]],
  [[1, 3],
   [5, 7]]])

这里是将轴二滚动到了轴零,也就是说原来索引一个数是a[x][y][z], 现在想要找到它的话就得是a[z][x][y],这样理解起来会好点.

####numpy.swapaxes 该函数交换数组的两个轴, ``` numpy.swapaxes(a, axis1, axis2) ```

参数	描述
a	输入数组
axis1	对应第一个轴的整数
axis2	对应第二个轴的整数

示例:

>>> a = np.arange(8).reshape(2,2,2)
>>> np.swapaxes(a,2,0)

array([[[0, 4],
[2, 6]],
  [[1, 5],
   [3, 7]]])

修改维度

方法	描述
broadcast	产生模仿广播的对象
broadcast_to	将数组广播到新的形状
expand_dims	扩展数组的形状
squeeze	从数组的形状中删除单维条目

broadcast

前面已经说明了numpy的广播功能,而此方法就是模仿广播的机制,它返回一个对象,该对象封装了将一个数组广播到另一个数组的结果.

>>> x = np.array([[1],[2],[3]])
>>> y = np.array([4,5,6])
>>> b = np.broadcast(x,y)
>>> out = np.empty(b.shape)
>>> out.flat = [u+v for (u,v) in b]
>>> out

array([[5., 6., 7.],
[6., 7., 8.],
[7., 8., 9.]])

numpy.broadcast_to

此函数将数组广播到新形状.

numpy.broadcast_to(a, shape, subok)

示例;

>>> a = np.arange(4).reshape(1,4)
>>> np.broadcast_to(a,(4,4))

array([[0, 1, 2, 3],
[0, 1, 2, 3],
[0, 1, 2, 3],
[0, 1, 2, 3]])

numpy.expand_dims

函数通过在指定位置插入新的轴来扩展数组形状.

numpy.expand_dims(a, axis)

参数	描述
a	输入数组
axis	新轴要插入的位置

示例;

>>> x = np.array(([1,2],[3,4]))
>>> y = np.expand_dims(x, axis = 1)
>>> print(y)

[[[1 2]]

[[3 4]]]

numpy.squeeze

函数从指定数组的形状中删除一维条目.

numpy.squeeze(a, axis)

参数	描述
a	输入数组
axis	整数或者整数元组,用于选择形状中单一维度条目的子集

示例:

>>> x = np.arange(9).reshape(1,3,3)
>>> y = np.squeeze(x)
>>> print(y)

[[0 1 2]
[3 4 5]
[6 7 8]]

数组的连接

方法	描述
concatenate	沿着现存的轴连接数据序列
stack	沿着新轴连接数组序列
hstack	水平堆叠序列中的数组(列方向)
vstack	竖直堆叠序列中的数组(行方向)

numpy.concatenate

此函数用于沿指定轴连接相同形状的两个或多个数组

numpy.concatenate((a1,a2,...), axis)

参数	描述
a1,a2,...	相同类型的数组序列
axis	沿着它连接数组的轴,默认为0

示例:

>>> a = np.array([[1,2],[3,4]])
>>> b = np.array([[5,6],[7,8]])
>>> np.concatenate((a,b))

array([[1, 2],
[3, 4],
[5, 6],
[7, 8]])

>>> a = np.array([[1,2],[3,4]])
>>> b = np.array([[5,6],[7,8]])
>>> np.concatenate((a,b),axis = 1)

array([[1, 2, 5, 6],
[3, 4, 7, 8]])

###numpy.stack 此函数沿着新轴连接数组序列. ``` numpy.stack(a, axis) ```

参数	描述
a	相同形状的数组序列
axis	返回数组中的轴,输入的数组沿着它来堆叠

示例:

>>> a = np.array([[1,2],[3,4]])
>>> b = np.array([[5,6],[7,8]])
>>> np.stack((a,b),0)

array([[[1, 2],
[3, 4]],
  [[5, 6],
   [7, 8]]])

>>> a = np.array([[1,2],[3,4]])
>>> b = np.array([[5,6],[7,8]])
>>> np.stack((a,b),1)

array([[[1, 2],
[5, 6]],
  [[3, 4],
   [7, 8]]])

numpy.hstack

它是numpy.stack的一个变体,通过堆叠来生成水平的单个数组
示例:

>>> a = np.array([[1,2],[3,4]])
>>> b = np.array([[5,6],[7,8]])
>>> np.hstack((a,b))

array([[1, 2, 5, 6],
[3, 4, 7, 8]])

numpy.vstack

同样,它也是numpy.stack的变体,通过堆叠来生成竖直的单个数组.
示例:

>>> a = np.array([[1,2],[3,4]])
>>> b = np.array([[5,6],[7,8]])
>>> np.vstack((a,b))

array([[1, 2],
[3, 4],
[5, 6],
[7, 8]])

数组分割

方法	描述
split	将一个数组分割为多个子数组
hsplit	将一个数组水平分割为多个子数组(按列)
vsplit	将一个数组竖直分割为多个子数组(按行)

numpy.split

该函数沿特定的轴将数组分割成子数组.

numpy.split(a, indices_or_sections, axis)

参数	描述
a	输入数组
indices_or_sections	整数则为要创建的子数组的数量,一维数组则为要创建子数组的点
axis	默认为0

示例:

>>> a = np.arange(9)
>>> b = np.split(a,3)
>>> print(b)

[array([0, 1, 2]), array([3, 4, 5]), >array([6, 7, 8])]

>>> a = np.arange(9)
>>> b = np.split(a,[4,7])
>>> print(b)

[array([0, 1, 2, 3]), array([4, 5, 6]), >array([7, 8])]

numpy.hsplit

同样,它是split的特例,其中轴为1表示水平分割,无论数组的维度是什么

示例:

>>> a = np.arange(16).reshape(4,4)
>>> b = np.hsplit(a,2)
>>> print(b)

[array([[ 0, 1],
[ 4, 5],
[ 8, 9],
[12, 13]]), array([[ 2, 3],
[ 6, 7],
[10, 11],
[14, 15]])]

numpy.vsplit

同样,vsplit也是split的一个特例,其中轴为0表示竖直分割,无论输入数组的维度是什么

示例:

>>> a = np.arange(16).reshape(4,4)
>>> b = np.vsplit(a,2)
>>> print(b)

[array([[0, 1, 2, 3],
[4, 5, 6, 7]]), array([[ 8, 9, >10, 11],
[12, 13, 14, 15]])]

添加/删除元素

方法	描述
resize	返回指定形状的新数组
append	将值添加到数组末尾
insert	沿着指定轴将值插入到指定下标之前
delete	返回删除掉的某个轴的子数组的新数组
unique	寻找数组内的唯一元素

numpy.resize

此函数返回指定大小的新数组,若新数组大小大于原始数组大小,则包含原始数组中元素的副本.

numpy.resize(a,shape)

参数	描述
a	输入数组
shape	返回数组的新形状

示例:

>>> a = np.array([[1,2,3],[4,5,6]])
>>> b = np.resize(a,(3,2))
>>> print(b)

[[1 2]
[3 4]
[5 6]]

numpy.append

此函数在输入数组的末尾添加值,附加操作不是原地的,而是返回新的数组.

numpy.append(a, values, axis)

参数	描述
a	输入数组
values	要向a中添加的值
axis	沿着它完成操作的轴,若不提供该参数,则数组会被展开

示例:

>>> a = np.array([[1,2,3],[4,5,6]])
>>> np.append(a, [7,8,9])

array([1, 2, 3, 4, 5, 6, 7, 8, 9])
这里就是由于未提供axis而被展开了

>>> a = np.array([[1,2,3],[4,5,6]])
>>> np.append(a, [[7,8,9]], axis=0)

array([[1, 2, 3],
[4, 5, 6],
[7, 8, 9]])

>>> a = np.array([[1,2,3],[4,5,6]])
>>> np.append(a, [[7,8,9], [10,11,12]], axis=1)

array([[ 1, 2, 3, 7, 8, 9],
[ 4, 5, 6, 10, 11, 12]])

numpy.insert

非原地操作,返回新数组,且同样未提供axis的话数组会被展开.

numpy.insert(a, obj, values, axis)

参数	描述
a	输入数组
obj	索引,在其之前插入
values	要插入的值
axis	沿着它插入的轴,若没有则展开数组

示例:

>>> a = np.array([[1,2],[3,4],[5,6]])
>>> np.insert(a,3,[7,8])

array([1, 2, 3, 7, 8, 4, 5, 6])

未传入参数axis,数组被展开

>>> a = np.array([[1,2],[3,4],[5,6]])
>>> np.insert(a,1,[7],axis = 0)

array([[1, 2],
[7, 7],
[3, 4],
[5, 6]])

这里在插入的同时广播了

numpy.delete

此函数返回从输入数组中删除指定子数组后的新数组.

numpy.delete(a, obj, axis)

参数	描述
a	输入数组
obj	可以是切片,整数或者整数数组,表示要从输入数组中删除的子数组
axis	沿着它删除指定数组的轴,若未提供,则展开数组

示例:

>>> a = np.arange(12).reshape(3,4)
>>> np.delete(a,5)

array([ 0, 1, 2, 3, 4, 6, 7, 8, >9, 10, 11])

>>> a = np.arange(12).reshape(3,4)
>>> np.delete(a,1,axis=1)

array([[ 0, 2, 3],
[ 4, 6, 7],
[ 8, 10, 11]])

numpy.unique

此函数返回输入数组中的去重元素数组和相关索引的数组.

numpy.unique(a, return_index, return_inverse, return_counts)

参数	描述
a	输入数组,若不是一维数组则会被展开
return_index	若为true,返回去重后剩下元素在输入数组中的下标
return_inverse	若为true,返回原始数组中元素在去重数组中的下标
return_counts	若为true,返回去重数组中的元素在原数组中的出现次数

示例:

>>> a = np.array([1,2,1,3,2,2,3])
>>> u = np.unique(a)
>>> print(u)

[1 2 3]

>>> a = np.array([1,2,1,3,2,2,3])
>>> u,indices = np.unique(a, return_index=True)
>>> print(indices)

[0 1 3]

>>> a = np.array([1,2,1,3,2,2,3])
>>> u,indices = np.unique(a, return_inverse=True)
>>> print(indices)

[0 1 0 2 1 1 2]

>>> a = np.array([1,2,1,3,2,2,3])
>>> u,indices = np.unique(a, return_counts=True)
>>> print(indices)

[2 3 2]

Numpy 位操作

Numpy 字符串操作

Numpy 算数函数

三角函数

舍入函数

Numpy算数运算

Numpy统计函数

Numpy中有很多有用的统计函数,用于从数组中查最小,最大元素,求标准差,方差等

numpy.amin()和numpy.amax()

从数组中的元素沿指定轴返回最大,最小值.

示例:

>>> a = np.array([[3,7,5],[8,4,3],[2,4,9]])
>>> np.amin(a,1)

array([3, 3, 2])

>>> a = np.array([[3,7,5],[8,4,3],[2,4,9]])
>>> np.amin(a,0)

array([2, 4, 3])

numpy.ptp()

该函数返回沿轴的值的范围(最大值-最小值)-是减去

示例:

>>> a = np.array([[3,7,5],[8,4,3],[2,4,9]])
>>> np.ptp(a)

7

>>> a = np.array([[3,7,5],[8,4,3],[2,4,9]])
>>> np.ptp(a, axis = 1)

array([4, 5, 7])

numpy.percentile()

百分位数是统计中使用的度量方法,表示小于这个百分比中的最大的数.

numpy.percentile(a, q, axis)

参数	描述
a	输入数组
q	要计算的百分位数,在0-100之间
axis	沿着它计算百分位数的轴

示例:

>>> a = np.array([[30,40,70],[80,20,10],[50,90,60]])
>>> np.percentile(a,50)

50.0

>>> a = np.array([[30,40,70],[80,20,10],[50,90,60]])
>>> np.percentile(a,50, axis = 0)

array([50., 40., 60.])

numpy.median()

中值定义为将数据样本的上半部分和下半部分分开的值.

示例:

>>> a = np.array([[30,65,70],[80,95,10],[50,90,60]])
>>> np.median(a)

65.0

>>> a = np.array([[30,65,70],[80,95,10],[50,90,60]])
>>> np.median(a, axis = 1)

array([65., 80., 60.])

numpy.mean()

算数平均值是沿轴的元素总和处以元素数量

示例:

>>> a = np.array([[30,65,70],[80,95,10],[50,90,60]])
>>> np.mean(a)

61.111111111111114

>>> a = np.array([[30,65,70],[80,95,10],[50,90,60]])
>>> np.mean(a, axis = 1)

array([55. , 61.66666667, >66.66666667])

numpy.average()

加权平均值是由每个分量乘以反映其重要性的因子得到的平均值.

示例:

>>> a = np.array([1,2,3,4])
>>> wts = np.array([4,3,2,1])
>>> np.average(a,weights = wts, returned = True)

(2.0, 10.0)

多维中可指定要计算的轴

>>> a = np.arange(6).reshape(3,2)
>>> wt = np.array([3,5])
>>> np.average(a, axis = 1, weights = wt, returned = True)

(array([0.625, 2.625, 4.625]), >array([8., 8., 8.]))

标准差

标准差是与均值的偏差的平方的平均值的平方根.

示例:

>>> print(np.std([1,2,3,4]))

2.1.118033988749895

方差

方差是偏差的平方的平均值,即标准差最后不开根号.

示例:

>>> print(np.var([1,2,3,4]))

1.25

Numpy排序,搜索,计数

numpy.sort()

该函数返回输入数组的排序副本.

numpy.sort(a, axis, kind, order)

参数	描述
a	待排序的数组
axis	沿着它排序的数组的轴,没有则展开数组
kind	默认为'quicksort',快排
order	如果数组包含字段,则是要排序的字段

示例:

>>> a = np.array([[3,7],[9,1]])
>>> np.sort(a,axis = 0)

array([[3, 1],
[9, 7]])

>>> dt = np.dtype([('name', 'S10'), ('age', int)])
>>> a = np.array([('raju',21),('anil',25),('ravi',17),('amar',27)], dtype = dt)
>>> np.sort(a, order = 'name')

array([(b'amar', 27), (b'anil', 25), (b'raju', 21), (b'ravi', 17)],
dtype=[('name', 'S10'), ('age', '<i8')])

numpy.argsort()

该函数对输入数组沿给定轴执行间接排序,并使用指定的排序类型返回数据的索引数组.

numpy.argsort(a, axis=1, kind='quicksort', order=None)

参数	列表
a	输入数组
axis	沿着它排序的数组的轴,没有则展开数组
kind	'quicksort', 'mergesort', 'heapsort', 'stable'
order	如果数组包含字段,则是要排序的字段

示例:

>>> x = np.array([3,1,2])
>>> y = np.argsort(x)
>>> print(y)

[1 2 0]

numpy.lexsort()

numpy.argmax() numpy.argmin()

这两个函数分别沿给定轴返回最大元素和最小元素的索引

示例:

>>> a = np.array([[30,40,50],[80,20,10],[50,90,60]])
>>> np.argmax(a)

7

>>> a = np.array([[30,40,50],[80,20,10],[50,90,60]])
>>> np.argmin(a,axis = 1)

array([0, 2, 0])

numpy.nonzero()

该函数返回输入数组中非零元素的索引值

示例:

>>> a = np.array([[0,0,50],[80,0,10],[0,90,0]])
>>> np.nonzero(a)

(array([0, 1, 1, 2]), array([2, 0, 2, 1]))

numpy.where()

该函数返回输入数组中满足给定条件的元素的索引

示例:

>>> a = np.array([[0,0,50],[80,0,10],[0,90,0]])
>>> np.where(a>0)

(array([0, 1, 1, 2]), array([2, 0, 2, 1]))

numpy.extract()

该函数返回输入数组中满足给定条件的元素的值

示例:

>>> a = np.array([[0,0,50],[80,0,10],[0,90,0]])
>>> np.extract(a>0,a)

array([50, 80, 10, 90])

Numpy副本和视图

在执行函数时,其中一些返回输入数组的副本,而另一些则返回视图.当内容的物理存储在另外一个位置时,称为副本,反之,则称为视图.

无复制

简单的赋值不会创建数组对象的副本.
示例:

>>> a = np.arange(6)
>>> b = a
>>> print("%s %s" % (id(a),id(b)))

139766633551472 139766633551472

视图的浅复制

ndarray.view(),数组的切片也如此,会创建视图,修改元素两个都会修改,但修改形状时只改变修改的那个

视图的深复制

ndarray.copy(),创建深层副本,修改形状,元素都不会对原来的产生影响

Numpy矩阵库

Numpy线性代数

参考:
https://blog.csdn.net/a373595475/article/details/79580734

posted @ 2018-12-13 11:48 樱花色的梦阅读(309) 评论(0) 收藏举报

刷新页面返回顶部