numpy 学习:数组的拼接、堆叠和拆分

拼接不会改变数组的维度,而堆叠会增加新的轴。

一,拼接

如果要把两份数据组合到一起,需要拼接操作。

numpy.concatenate((a1, a2, ...), axis=0, out=None)

参数axis默认值是0,标识按照行来拼接,如果设置为None,那么所有的数组将展开为一维,并拼接在一起。

对二维数组进行拼接

x = np.array([[1, 2, 3], [4, 5, 6]])
y = np.array([[7, 8, 9], [10, 11, 12]])
z = np.concatenate([x, y], axis=0)
print(z)
# [[ 1  2  3]
#  [ 4  5  6]
#  [ 7  8  9]
#  [10 11 12]]
z = np.concatenate([x, y], axis=1)
print(z)
# [[ 1  2  3  7  8  9]
#  [ 4  5  6 10 11 12]]

二,堆叠,沿着新加入数组

np.stack的作用是沿着新的轴堆叠一个数组:

  • 沿新轴:默认是axis=0
  • 加入数组是指:新生成的数组会比用来进行拼接的原数组多一个维度.

一维数组相当于是1行N列的数组,当使用column_stack()时,该一维数组作为一个新列;当使用hstack()函数时,为原始数组新增N列;当使用vstack()函数时,为原始数组新增1行。

1,把一维数组作为列添加到二维数组中

tup是一个数组的序列,按照列堆叠时,相当于二维数组新增一列;按照行堆叠时,相当于增加一列行:

numpy.column_stack(tup)
numpy.row_stack(tup)

举个例子,把两个一维数组按照行/列堆叠成一个二维数组:

>>> a = np.array([1, 2, 3])
>>> b = np.array([4, 5, 6])
>>> np.row_stack((a,b))
array([[1, 2, 3],
       [4, 5, 6]])
>>> np.column_stack((a,b))
array([[1, 4],
       [2, 5],
       [3, 6]])

2,按维度堆叠数组

按列对原始数组进水平(horizontally ,column),垂直(vertically ,row)或者深度(depth,third asix)扩展,参数tup是数组的序列,参数axis表示沿着这个轴。

numpy.stack(arrays, axis=0)
numpy.hstack(tup)
numpy.vstack(tup)
numpy.dstack(tup)

举个例子,分别对数组进行列堆叠、水平堆叠和垂直堆叠:

>>> a = np.array([1, 2, 3])
>>> b = np.array([4, 5, 6])

>>> np.vstack((a,b))
array([[1, 2, 3],
       [4, 5, 6]])
>>> np.hstack((a,b))
array([1, 2, 3, 4, 5, 6])
>>> np.dstack((a,b))
array([[[1, 4],
        [2, 5],
        [3, 6]]])

例子 1 ,对于两个一维数组,堆叠之后,变成一个二维数组:

x = np.array([1, 2, 3])
y = np.array([7, 8, 9])
z = np.stack([x, y]) # axis=0
print(z.shape)  # (2, 3)
print(z)
# [[1 2 3]
#  [7 8 9]]

z = np.stack([x, y], axis=1)
print(z.shape)  # (3, 2)
print(z)
# [[1 7]
#  [2 8]
#  [3 9]]

解释堆叠的过程:

  • 沿着行来堆叠数组是指分别取出两个数组的一行,作为新的一列;依次类推。
  • 沿着列来堆叠数组是指分别取出两个数组的一列,作为新的一行;依次类推。

例子2, 对于两个二维数组进行堆叠,会变成一个三维数组。

x = np.array([[1, 2, 3], [4, 5, 6]])
y = np.array([[7, 8, 9], [10, 11, 12]])

z = np.stack([x, y], axis=0)
print(z.shape)  # (2,2,3)
print(z)
#[[[ 1  2  3]
#  [ 4  5  6]]
#
# [[ 7  8  9]
#  [10 11 12]]]

z = np.stack([x, y], axis=1)
print(z.shape)  # (2, 2, 3)
print(z)
# [[[ 1  2  3]
#   [ 7  8  9]]
# 
#  [[ 4  5  6]
#   [10 11 12]]]

z = np.stack([x, y], axis=2)
print(z.shape)  # (2, 3, 2)
print(z)
# [[[ 1  7]
#   [ 2  8]
#   [ 3  9]]
# 
#  [[ 4 10]
#   [ 5 11]
#   [ 6 12]]]

解释堆叠的过程:可以把二维数组看作是“一维数组”,这个“一维数组”只有一行,列是一个数组。

举例:新的一维数组只有两个列:[ 1 2 3],[ 4 5 6],这两列构成一行。

  • 沿着行来堆叠数组的过程是:分别取出“一维数组”的行(行是一个二维数组),作为新的一行,堆叠在一起。
  • 沿着列来堆叠数组的过程是:分别取出“一维数组”的列(列是一维数组级别),作为新的一行,堆叠在一起。
  • 沿着深度类堆叠数组的过程是:分别取出“一维数组”的列的元素(元素级别),作为新的深度,堆叠在一起。

三,拆分

把一个数组拆分成一个或多个子数组,作为原始数组的视图。

numpy.split(ary, indices_or_sections, axis=0)
numpy.vsplit(ary, indices_or_sections)
numpy.hsplit(ary, indices_or_sections)

参数注释:

indices_or_sections:int或一维数组,

如果indexs_or_sections是整数N,则该数组将沿轴分为N个相等的数组。如果无法进行此类拆分,则会引发错误。

如果indexs_or_sections是一维有序的整数数组(数组的元素是特定的位置序号,即索引,从0开始),那么沿轴在相应的位置处拆分该数组。如果沿轴的索引超出数组的维数,那么将相应返回一个空的子数组。

x = np.array([[11, 12, 13, 14],
              [16, 17, 18, 19],
              [21, 22, 23, 24]])
y = np.split(x, [1, 3])
print(y)
# [array([[11, 12, 13, 14]]), array([[16, 17, 18, 19],
#        [21, 22, 23, 24]]), array([], shape=(0, 4), dtype=int32)]

y = np.split(x, [1, 3], axis=1)
print(y)
# [array([[11],
#        [16],
#        [21]]), array([[12, 13],
#        [17, 18],
#        [22, 23]]), array([[14],
#        [19],
#        [24]])]

 参考文档:

 

posted @ 2022-01-05 14:15  悦光阴  阅读(2667)  评论(0编辑  收藏  举报