NumPy 学习：索引和切片

数组索引是指使用中括号 [] 来定位数据元素，不仅可以定位到单个元素，也可以定位到多个元素。索引基于0，并接受从数组末尾开始索引的负索引。

举个例子，正向索引从0开始，从数组开始向末尾依次加1递增；负向索引从-1开始，逐个元素 -1 ，不管使用正向索引还是负向索引，最右侧的元素的索引值是最大的，最左侧的元素的索引值是最小的。

>>> x = np.arange(10)
>>> x[2]
2
>>> x[-2]
8

切片操作是指抽取数组的一部分元素生成新数组，对numpy数组进行切片操作得到的是数组的视图，指向相同的内存存储区。如果想抽取（或查看）数组的一部分，必须使用切片语法，也就是，把几个用冒号（ start:stop:step ）隔开的数字置于方括号内。

一，单个元素的索引

ndarray对象的元素可以通过索引来访问和修改，索引基于0。要定位到单个元素，对于一维数组，只需要一个索引；对于二维数组，需要两个维度的索引。

1，一维数组的索引

一维数组最简单，只有一个维度，中括号中只有一个索引idx，正向索引idx 从0开始，负向索引从-1开始：

arr = np.arange(10)

arr[idx]

2，二维数组的索引

在一个二维数组中，一个索引位置上的元素不再是标量，而是一维数组。要索引到单个标量元素，需要在中括号中分别指定行维度和列维度的索引，索引都是从0开始：

arr2d=np.array([[1,2,3],[4,5,6],[7,8,9]])

>>> arr2d[2]
# array([7,8,9])
>>> arr2d[0][2]
#3
>>> arr2d[0,2]
#3

对于更高维度的数组，一个中括号表示一个维度，索引的使用依此类推。

二，数组的切片

数组的切片操作是指抽取数组的一部分元素生成新数组，对numpy数组进行切片操作得到的是数组的视图，指向相同的内存存储区。如果想抽取（或查看）数组的一部分，必须使用切片语法，也就是，把几个用冒号（ start:stop:step ）隔开的数字置于方括号内。

数组的切片是Python基本切片的概念从一维到N维的扩展，通过中括号，start，stop和step参数提供给内置函数的slice函数来构造一个Python slice对象，把slice对象传递给数组，提取数组的一部分。

1，切片的格式

切片的格式是[start:end:step]，如果省略start，使用start的默认值0；如果省略end，那么end的默认值是维度长度-1；如果省略step，使用step的默认值1。通常情况下，数组的切片是[start:end]，这就意味着使用step的默认值1。

arr = np.array(n)
arr[start:end]
arr[start:end:step]

2，浅拷贝（视图）

数组切片是原始数组的浅拷贝，也叫视图，修改切片中的原始，会直接修改原始数据。

对于一维数组，数组切片上的任何修改都会直接修改原始数组：

arr = np.arange(10)
arr_slice=arr[5:8]
arr_slice[1]=111
#arr=array([0,1,2,3,4,5,111,7,8,9])

arr_slice[:]=222
#arr=array([0,1,2,3,4,222,222,222,8,9])

对于二维数组，一个中括号表示一个维度，依此类推。

>>> y = np.arange(35).reshape(5,7)
>>> y[1:5:2,::3]
array([[ 7, 10, 13],
       [21, 24, 27]])

4，深拷贝（副本）

调用copy()方法对数组创建一个深拷贝，也叫副本，深拷贝是生成数组及其数据的完整副本。

例如，b是a的深拷贝，修改数组a不会影响数组b：

b = a.copy()

三，索引数组

NumPy数组可以使用其他数组（或任何其他可以转换为数组的类似序列的对象，如列表，除元组之外的索引）作为索引。对于索引数组的所有情况，返回的是原始数据的副本（深拷贝），而不是切片获取的视图。

索引数组必须是整数类型。数组中的每个值指示要使用的数组中的哪个值代替索引：

>>> x = np.arange(10,1,-1)
>>> x
array([10,  9,  8,  7,  6,  5,  4,  3,  2])
>>> x[np.array([3, 3, 1, 8])]
array([7, 7, 9, 2])

由值3,3,1和8组成的索引数组相应地创建一个长度为4的数组（与索引数组相同），其中每个索引由索引数组在被索引的数组中具有的值替换。

允许使用负值，并且与单个索引或切片一样工作：

>>> x[np.array([3,3,-3,8])]
array([7, 7, 4, 2])

一般来说，使用索引数组时返回的是与索引数组具有相同形状的数组，但索引的数组的类型和值。作为示例，我们可以使用多维索引数组：

>>> x[np.array([[1,1],[2,3]])]
array([[9, 9],
       [8, 7]])

四，掩码索引数组

如果索引数组的元素类型是布尔，把该索引数组称作布尔或掩码索引数组。整数索引数组，元素是数组的索引值，而对于掩码索引数组，元素值是True或False，掩码索引数组和数据数组的形状相同，一个掩码索引对应一个数据数组的元素。当掩码为True时，选择该位置对应的元素；当掩码为False，忽略该位置对应的元素。

>>> b = y>20
>>> y[b]
array([21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34])

五，数组的迭代

对数据中的轴中的每个元素应用函数：

apply_along_axis(func1d, axis, arr)

举个例子，对一个二维数据nd，如果axis=0，表示沿着x轴，计算各个列元素的加和，同理，如果axis=1，表示沿着y轴，计算各个行元素的加和。

nd = np.array([[11, 12, 13, 14, 15],
              [16, 17, 18, 19, 20],
              [21, 22, 23, 24, 25],
              [26, 27, 28, 29, 30],
              [31, 32, 33, 34, 35]])

x = np.apply_along_axis(np.sum, 0, nd)
print(x)  
# [105 110 115 120 125]

y = np.apply_along_axis(np.sum, 1, nd)
print(y)  
# [ 65  90 115 140 165]

参考文档：

NumPy 索引

posted @ 2019-10-10 10:35 悦光阴阅读(2707) 评论(0) 收藏举报

刷新页面返回顶部

悦光阴

请不要假装很努力，因为结果不会陪你演戏。