NumPy 学习:索引和切片

数组索引是指使用中括号 [] 来定位数据元素,不仅可以定位到单个元素,也可以定位到多个元素。索引基于0,并接受从数组末尾开始索引的负索引。

举个例子,正向索引从0开始,从数组开始向末尾依次加1递增;负向索引从-1开始,逐个元素 -1 ,不管使用正向索引还是负向索引,最右侧的元素的索引值是最大的,最左侧的元素的索引值是最小的。

>>> x = np.arange(10)
>>> x[2]
2
>>> x[-2]
8

切片操作是指抽取数组的一部分元素生成新数组,对numpy数组进行切片操作得到的是数组的视图,指向相同的内存存储区。如果想抽取(或查看)数组的一部分,必须使用切片语法,也就是,把几个用冒号( start:stop:step )隔开的数字置于方括号内。

一,单个元素的索引

ndarray对象的元素可以通过索引来访问和修改,索引基于0。要定位到单个元素,对于一维数组,只需要一个索引;对于二维数组,需要两个维度的索引。

1,一维数组的索引

一维数组最简单,只有一个维度,中括号中只有一个索引idx,正向索引idx 从0开始,负向索引从-1开始:

arr = np.arange(10)

arr[idx]

2,二维数组的索引

在一个二维数组中,一个索引位置上的元素不再是标量,而是一维数组。要索引到单个标量元素,需要在中括号中分别指定行维度和列维度的索引,索引都是从0开始:

arr2d=np.array([[1,2,3],[4,5,6],[7,8,9]])

>>> arr2d[2]
# array([7,8,9])
>>> arr2d[0][2]
#3
>>> arr2d[0,2]
#3

对于更高维度的数组,一个中括号表示一个维度,索引的使用依此类推。

二,数组的切片

数组的切片操作是指抽取数组的一部分元素生成新数组,对numpy数组进行切片操作得到的是数组的视图,指向相同的内存存储区。如果想抽取(或查看)数组的一部分,必须使用切片语法,也就是,把几个用冒号( start:stop:step )隔开的数字置于方括号内。

数组的切片是Python基本切片的概念从一维到N维的扩展,通过中括号,start,stop和step参数提供给内置函数的slice函数来构造一个Python slice对象,把slice对象传递给数组,提取数组的一部分。

1,切片的格式

切片的格式是[start:end:step],如果省略start,使用start的默认值0;如果省略end,那么end的默认值是 维度长度-1;如果省略step,使用step的默认值1。通常情况下,数组的切片是[start:end],这就意味着使用step的默认值1。

arr = np.array(n)
arr[start:end]
arr[start:end:step]

2,浅拷贝(视图)

数组切片是原始数组的浅拷贝,也叫视图,修改切片中的原始,会直接修改原始数据。

对于一维数组,数组切片上的任何修改都会直接修改原始数组:

arr = np.arange(10)
arr_slice=arr[5:8]
arr_slice[1]=111
#arr=array([0,1,2,3,4,5,111,7,8,9])

arr_slice[:]=222
#arr=array([0,1,2,3,4,222,222,222,8,9])

对于二维数组,一个中括号表示一个维度,依此类推。

>>> y = np.arange(35).reshape(5,7)
>>> y[1:5:2,::3]
array([[ 7, 10, 13],
       [21, 24, 27]])

4,深拷贝(副本)

调用copy()方法对数组创建一个深拷贝,也叫副本,深拷贝是生成数组及其数据的完整副本。

例如,b是a的深拷贝,修改数组a不会影响数组b:

b = a.copy()

三,索引数组

NumPy数组可以使用其他数组(或任何其他可以转换为数组的类似序列的对象,如列表,除元组之外的索引)作为索引。对于索引数组的所有情况,返回的是原始数据的副本(深拷贝),而不是切片获取的视图。

索引数组必须是整数类型。数组中的每个值指示要使用的数组中的哪个值代替索引:

>>> x = np.arange(10,1,-1)
>>> x
array([10,  9,  8,  7,  6,  5,  4,  3,  2])
>>> x[np.array([3, 3, 1, 8])]
array([7, 7, 9, 2])

由值3,3,1和8组成的索引数组相应地创建一个长度为4的数组(与索引数组相同),其中每个索引由索引数组在被索引的数组中具有的值替换。

允许使用负值,并且与单个索引或切片一样工作:

>>> x[np.array([3,3,-3,8])]
array([7, 7, 4, 2])

一般来说,使用索引数组时返回的是与索引数组具有相同形状的数组,但索引的数组的类型和值。作为示例,我们可以使用多维索引数组:

>>> x[np.array([[1,1],[2,3]])]
array([[9, 9],
       [8, 7]])

四,掩码索引数组

如果索引数组的元素类型是布尔,把该索引数组称作布尔或掩码索引数组。整数索引数组,元素是数组的索引值,而对于掩码索引数组,元素值是True或False,掩码索引数组和数据数组的形状相同,一个掩码索引对应一个数据数组的元素。当掩码为True时,选择该位置对应的元素;当掩码为False,忽略该位置对应的元素。

>>> b = y>20
>>> y[b]
array([21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34])

五,数组的迭代

对数据中的轴中的每个元素应用函数:

apply_along_axis(func1d, axis, arr)

举个例子,对一个二维数据nd,如果axis=0,表示沿着x轴,计算各个列元素的加和,同理,如果axis=1,表示沿着y轴,计算各个行元素的加和。

nd = np.array([[11, 12, 13, 14, 15],
              [16, 17, 18, 19, 20],
              [21, 22, 23, 24, 25],
              [26, 27, 28, 29, 30],
              [31, 32, 33, 34, 35]])

x = np.apply_along_axis(np.sum, 0, nd)
print(x)  
# [105 110 115 120 125]

y = np.apply_along_axis(np.sum, 1, nd)
print(y)  
# [ 65  90 115 140 165]

 

 

 

 

参考文档:

NumPy 索引

posted @ 2019-10-10 10:35  悦光阴  阅读(2572)  评论(0编辑  收藏  举报