NumPy 排序、条件刷选函数

NumPy 提供了多种排序的方法。这些排序函数实现不同的排序算法，每个排序算法的特征在于执行速度，最坏情况性能，所需的工作空间和算法的稳定性。下表显示了三种排序算法的比较。

种类	速度	最坏情况	工作空间	稳定性
`'quicksort'`（快速排序）	1	`O(n^2)`	0	否
`'mergesort'`（归并排序）	2	`O(n*log(n))`	~n/2	是
`'heapsort'`（堆排序）	3	`O(n*log(n))`	0	否

numpy.sort()

numpy.sort() 函数返回输入数组的排序副本。函数格式如下：

numpy.sort(a, axis, kind, order)

参数说明：

a: 要排序的数组
axis: 沿着它排序数组的轴，如果没有数组会被展开，沿着最后的轴排序， axis=0 按列排序，axis=1 按行排序
kind: 默认为'quicksort'（快速排序）
order: 如果数组包含字段，则是要排序的字段

import numpy as np

a=np.array([[3,4],[9,5]])

print('我们的数组是：')

print(a)

print('\n')

print('调用sort()函数')

print(np.sort(a))

print('\n')

print('按列排序：')

print(np.sort(a,0))

print('\n')

# 在 sort 函数中排序字段

dt=np.dtype([('name','S10'),('age','int')])

a=np.array([('Tom','21'),('Mary','32'),('Tim','12')],dtype=dt)

print('我们的数组是：')

print(a)

print('\n')

print('按姓名排序：')

print(np.sort(a,order='name'))

--------------------执行以上程序，返回的结果为--------------

我们的数组是：
[[3 4]
[9 5]]

调用sort()函数
[[3 4]
[5 9]]

按列排序：
[[3 4]
[9 5]]

我们的数组是：
[(b'Tom', 21) (b'Mary', 32) (b'Tim', 12)]

按姓名排序：
[(b'Mary', 32) (b'Tim', 12) (b'Tom', 21)]

numpy.argsort()

numpy.argsort() 函数返回的是数组值从小到大的索引值。

import numpy as np
a=np.array([3,1,2])
print('我们的数组是：')
print(a)
print('\n')
print('对a调用argsort()函数')
b=np.argsort(a)
print(b)
print('\n')
print ('以排序后的顺序重构原数组：(以b的顺序返回a)')
print (a[b])
print ('\n')
print('使用循环重构原数组：')
for x in b:
    print(a[x],end=' ')

--------------------执行以上程序，返回的结果为--------------

我们的数组是：
[3 1 2]

对a调用argsort()函数
[1 2 0]

以排序后的顺序重构原数组：(以b的顺序返回a)
[1 2 3]

使用循环重构原数组：
1 2 3

numpy.lexsort()

numpy.lexsort() 用于对多个序列进行排序。把它想象成对电子表格进行排序，每一列代表一个序列，排序时优先照顾靠后的列。

这里举一个应用场景：小升初考试，重点班录取学生按照总成绩录取。在总成绩相同时，数学成绩高的优先录取，在总成绩和数学成绩都相同时，按照英语成绩录取…… 这里，总成绩排在电子表格的最后一列，数学成绩在倒数第二列，英语成绩在倒数第三列。

import numpy as np

a=[1,5,1,4,3,4,4]
b=[9,4,0,4,0,2,1]
ind=np.lexsort((b,a))

print(ind)

print ('使用这个索引来获取排序后的数据：')
print ([str(b[i]) + ", " + str(a[i]) for i in ind])
# b在前，a在后，即是先按照a的元素进行比较
# 如a中的最小值为两个1，其索引分别为0,2，再计较b中相应索引上的值，即9,0
# 对应的最小应是：1,0，而其对应的索引为2，所以排序后返回的结果第一个值为索引2
# 下一个最小应是：1,9，而其对应的索引为0，所以排序后返回的结果第一个值为索引0
# 以此类推...

--------------------执行以上程序，返回的结果为--------------

[2 0 4 6 5 3 1]

使用这个索引来获取排序后的数据：
['0,1', '9,1', '0,3', '1,4', '2,4', '4,4', '4,5']

msort、sort_complex、partition、argpartition

函数	描述
msort(a)	数组按第一个轴排序，返回排序后的数组副本。np.msort(a) 相等于 np.sort(a, axis=0)。
sort_complex(a)	对复数按照先实部后虚部的顺序进行排序。
partition(a, kth[, axis, kind, order])	指定一个数，对数组进行分区
argpartition(a, kth[, axis, kind, order])	可以通过关键字 kind 指定算法沿着指定轴对数组进行分区

复数排序：

import numpy as np
a=np.sort_complex([5, 3, 6, 2, 1])
print(a)

b=np.sort_complex([1 + 2j, 2 - 1j, 3 - 2j, 3 - 3j, 3 + 5j])
print(b)

----------------执行以上程序，返回的结果为---------------

[1.+0.j 2.+0.j 3.+0.j 5.+0.j 6.+0.j]

[1.+2.j 2.-1.j 3.-3.j 3.-2.j 3.+5.j]

partition() 分区排序：

import numpy as np
list=[2,3,5,4,1]

# 以排序后的第3个数，即3进行分区，分区后的结果即是：
# 小于3的元素2,1位于3的前面，大于等于3的元素4,5位于3的后面

a=np.partition(list,3)

print(a)

----------------执行以上程序，返回的结果为---------------

[1 2 3 4 5]

argpartition()排序：

import numpy as np
list=[2,3,5,4,1]
a=np.partition(list,4)

# 以排序后的第4个数，即4进行分区，分区后的结果即是：
# 小于4的元素1,2,3位于4的前面，大于等于4的元素4,5位于4的后面

# 返回排序后的数字对应原来位置的索引值
b=np.argpartition(list,3)
print(a)
print(b)

----------------执行以上程序，返回的结果为---------------

[1 2 3 4 5]

[4 0 1 3 2]

numpy.argmax() 和 numpy.argmin()

numpy.argmax() 和 numpy.argmin()函数分别沿给定轴返回最大和最小元素的索引。

import numpy as np
a=np.array([[20,30,70],[40,10,80],[50,70,90]])

print('我们的数组是：')

print(a)

print('\n')

print('调用argmax()函数：')

print(np.argmax(a))

print('展开数组：')

print(a.flatten())

print('沿1轴的最大值索引：')

print(np.argmax(a,axis=1))

print('沿0轴的最大值索引：')

print(np.argmax(a,axis=0))

print('调用argmin()函数：')

print(np.argmin(a))

print('沿1轴的最小值索引:')

print(np.argmin(a,axis=1))

print('沿0轴的最小值索引：')

print(np.argmin(a,axis=0))

----------------执行以上程序，返回的结果为---------------

我们的数组是：
[[20 30 70]
[40 10 80]
[50 70 90]]

调用argmax()函数：
8
展开数组：
[20 30 70 40 10 80 50 70 90]
沿1轴的最大值索引：
[2 2 2]
沿0轴的最大值索引：
[2 2 2]
调用argmin()函数：
4
沿1轴的最小值索引:
[0 1 0]
沿0轴的最小值索引：
[0 1 0]

numpy.nonzero()

numpy.nonzero() 函数返回输入数组中非零元素的索引。

import numpy as np

a=np.array([[0,30,70],[40,0,80],[50,70,0]])

print('我们的数组是：')

print(a)

print('调用nonzero()函数：')

print(np.nonzero(a))

----------------执行以上程序，返回的结果为---------------

我们的数组是：
[[ 0 30 70]
[40 0 80]
[50 70 0]]

调用nonzero()函数：
(array([0, 0, 1, 1, 2, 2], dtype=int64), array([1, 2, 0, 2, 0, 1], dtype=int64))

numpy.where()

numpy.where() 函数返回输入数组中满足给定条件的元素的索引。

import numpy as np
a=np.arange(9).reshape(3,3)

print('我们的数组是：')

print(a)

print('大于元素3的索引：')

b=np.where(a>3)

print(b)

print('使用这些索引来获取满足条件的元素：')

print(a[b])

----------------执行以上程序，返回的结果为---------------

我们的数组是：
[[0 1 2]
[3 4 5]
[6 7 8]]
大于元素3的索引：
(array([1, 1, 2, 2, 2], dtype=int64), array([1, 2, 0, 1, 2], dtype=int64))
使用这些索引来获取满足条件的元素：
[4 5 6 7 8]

numpy.extract()

numpy.extract() 函数根据某个条件从数组中抽取元素，返回满条件的元素。

import numpy as np
a=np.arange(9).reshape(3,3)

print('我们的数组是：')

print(a)

#定义条件，选择偶数元素

condition=np.mod(a,2)==0

print(condition)

print('使用条件提取元素：')

print(np.extract(condition,a))

----------------执行以上程序，返回的结果为---------------

我们的数组是：
[[0 1 2]
[3 4 5]
[6 7 8]]

按元素的条件值：
[[ True False True]
[False True False]
[ True False True]]

使用条件提取元素：
[0 2 4 6 8]

发表于 2019-08-01 17:09 我不叫闹心阅读(211) 评论(0) 编辑收藏举报

numpy.sort()

numpy.argsort()

numpy.lexsort()

msort、sort_complex、partition、argpartition

numpy.argmax() 和 numpy.argmin()

numpy.nonzero()

numpy.where()

numpy.extract()

公告