NumPy进阶80题完整版｜附Notebook版本下载

前言

大家好，NumPy进阶修改80题现在已经全部更新完毕，80道习题涵盖了NumPy中数组创建、访问、筛选、修改、计算等常用操作，如果不熟悉NumPy的读者可以刷一遍，因为里面的代码大多拿走就能用，所以如果你已经了解NumPy的基本操作，我更建议将这80题当成速查手册使用，随用随查！本文共分为两个部分：

完整版NumPy80题
Notebook版下载方式

完整版80题

1.导入并查看NumPy版本

import numpy as np
print(np.__version__)

1.15.4

2.创建十个全为0的一维数组

np.zeros(10)

array([0., 0., 0., 0., 0., 0., 0., 0., 0., 0.])

3.创建10个全为0的一维数据并修改数据类型为整数

np.zeros(10,dtype = 'int')

array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0])

4.创建20个0-100固定步长的数

np.arange(0,100,5)

array([ 0,  5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80,
       85, 90, 95])

5.从list创建数组

List = [1,2,3,4,5,6,7,8,9]
result = np.array(List)
result

array([1, 2, 3, 4, 5, 6, 7, 8, 9])

6.创建一个三行三列全是1的矩阵

#方法1
np.ones((3,3))
#方法2
np.array([[ 1., 1., 1.],
       [ 1., 1., 1.],
       [ 1., 1., 1.]])

array([[1., 1., 1.],
       [1., 1., 1.],
       [1., 1., 1.]])

7.创建一个2行2列矩阵并且元素为布尔类型的True

np.full((2,2), True, dtype=bool)

array([[ True,  True],
       [ True,  True]])

8.创建等差数列

备注：从5开始，50结束，共10个数据

np.linspace(start=5,stop=50,num=10)

array([ 5., 10., 15., 20., 25., 30., 35., 40., 45., 50.])

9.创建等差数列

备注：从5开始，50结束，共10个数据，数据类型为int32
思考：与上一题不同

np.arange(start = 5, stop = 55, step = 5,dtype = 'int32')

array([ 5, 10, 15, 20, 25, 30, 35, 40, 45, 50], dtype=int32)

10.创建3x3矩阵

备注：矩阵元素均为0—10之间的随机数

np.random.randint(0,10,(3,3))

array([[9, 8, 2],
       [5, 1, 1],
       [6, 0, 3]])

11.创建3x3矩阵

备注：矩阵元素均为服从标准正态分布的随机数

np.random.randn(3, 3)

array([[-1.82084149,  1.57679054, -0.28167398],
       [ 0.78497073,  1.08230743,  0.66150165],
       [-1.32122518, -0.50510931,  0.55786583]])

12.将第五题的result修改为3x3矩阵

result = result.reshape(3,3)

13.对上一题生成的result取转置

result.T

array([[1, 4, 7],
       [2, 5, 8],
       [3, 6, 9]])

14.查看result的数据类型

result.dtype
#dtype('int64')

dtype('int64')

15.查看result的内存占用

#方法一：直接查看
print(result.nbytes)
#方法2手动计算
print(result.itemsize * 9)

72
72

16.将result的数据类型修改为float

result = result.astype(float)

17.提取result第三行第三列的元素

result[2,2]

9.0

18.将result第三行第三列的元素放大十倍

result[2,2] = result[2,2] * 10

19.提取result中的所有偶数

result[result % 2 == 0]

array([ 2.,  4.,  6.,  8., 90.])

20.将result中所有奇数修改为666

result[result % 2 == 1] = 666

NumPy进阶修炼80题第二期｜基本矩阵操作与运算

import numpy as np

21.创建主对角线都是5的5x5矩阵

result = np.diag([5,5,5,5,5])
result

array([[5, 0, 0, 0, 0],
       [0, 5, 0, 0, 0],
       [0, 0, 5, 0, 0],
       [0, 0, 0, 5, 0],
       [0, 0, 0, 0, 5]])

22.交换第一列与第二列

a = result[:, [1,0,2,3,4]]

23.交换第一行与第二行

b = result[[0,1,2,4,3], :]

24.判断两个矩阵是否有任何元素不同(使用22,23两题得到的矩阵)

print((a == b).all())

25.计算两个矩阵不同元素的个数(使用22,23两题得到的矩阵)

len(np.argwhere(a != b))

26.找到两个矩阵不同元素的位置(使用22,23两题得到的矩阵)

np.argwhere(a != b)

27.矩阵乘法(使用22,23两题得到的矩阵)

np.dot(a,b)

28.矩阵对应元素相乘(使用22,23两题得到的矩阵)

print(np.multiply(a,b))
print('========方法2========')
print(a * b) #方法2

29.计算行列式(使用21题生成的矩阵)

np.linalg.det(result)

30.矩阵求逆(使用21题生成的矩阵)

np.linalg.inv(result)

31.将22与23题生成的np.array对象修改为np.matrix对象

a = np.matrix(a)
b = np.matrix(b)

32.计算上一题生成的两个np.matrix格式矩阵的对应元素乘积（对比异同）

np.multiply(a,b)

33.对31题生成的两个np.matrix格式矩阵做矩阵乘法（对比异同）

a * b

34.将两个矩阵按照行拼接

np.hstack((a,b))

35.将两个矩阵按照列拼接

np.vstack((a,b))

36.思考下面代码运行后new的结果

new = np.pad(result,pad_width = 1,constant_values=1)

37.找到new中大于1的元素的位置

np.argwhere(new > 1)

38.将new中大于1的元素修改为9

new[new > 1] = 8
new

39.对new按列求和

np.sum(new, 0)

40.对new按行求和

np.sum(new, 1)

NumPy进阶修炼第三期｜41-60

import numpy as np
import pandas as pd
import warnings
warnings.filterwarnings("ignore")

41 生成指定格式数据

备注：使用numpy生成6行6列的二维数组，值为1-100随机数

data = np.random.randint(1,100, [6,6])
data

array([[28, 77, 35, 79, 44, 93],
       [33, 51, 56, 56, 73, 56],
       [53, 44, 73, 63, 29, 71],
       [25, 90, 87, 51, 44, 30],
       [50, 39,  7, 29, 83, 89],
       [18,  8, 75, 33, 40, 64]])

42 找到每列的最大值

np.amax(data, axis=0)

array([53, 90, 87, 79, 83, 93])

43 找到每行的最小值

np.amin(data, axis=1)

array([28, 33, 29, 25,  7,  8])

44 提取data每个元素的出现次数

np.unique(data,return_counts=True)

(array([ 7,  8, 18, 25, 28, 29, 30, 33, 35, 39, 40, 44, 50, 51, 53, 56, 63,
        64, 71, 73, 75, 77, 79, 83, 87, 89, 90, 93]),
 array([1, 1, 1, 1, 1, 2, 1, 2, 1, 1, 1, 3, 1, 2, 1, 3, 1, 1, 1, 2, 1, 1,
        1, 1, 1, 1, 1, 1]))

45 获取data每行元素的大小排名

data.argsort()

array([[0, 2, 4, 1, 3, 5],
       [0, 1, 2, 3, 5, 4],
       [4, 1, 0, 3, 5, 2],
       [0, 5, 4, 3, 2, 1],
       [2, 3, 1, 0, 4, 5],
       [1, 0, 3, 4, 5, 2]])

46 将数组按行重复一次

np.repeat(data, 2, axis=0)

array([[28, 77, 35, 79, 44, 93],
       [28, 77, 35, 79, 44, 93],
       [33, 51, 56, 56, 73, 56],
       [33, 51, 56, 56, 73, 56],
       [53, 44, 73, 63, 29, 71],
       [53, 44, 73, 63, 29, 71],
       [25, 90, 87, 51, 44, 30],
       [25, 90, 87, 51, 44, 30],
       [50, 39,  7, 29, 83, 89],
       [50, 39,  7, 29, 83, 89],
       [18,  8, 75, 33, 40, 64],
       [18,  8, 75, 33, 40, 64]])

47 去除数组的重复行

np.unique(data,axis = 0)

array([[18,  8, 75, 33, 40, 64],
       [25, 90, 87, 51, 44, 30],
       [28, 77, 35, 79, 44, 93],
       [33, 51, 56, 56, 73, 56],
       [50, 39,  7, 29, 83, 89],
       [53, 44, 73, 63, 29, 71]])

48 不放回抽样

备注：从data的第一行中不放回抽3个元素

np.random.choice(data[0:1][0], 3, replace=False)

array([77, 35, 93])

49 提取data第二行中不含第三行的元素的元素

a = data[1:2]
b = data[2:3]
index=np.isin(a,b)
array=a[~index]
array

array([33, 51, 56, 56, 56])

50 判断data是否有空行

(~data.any(axis=1)).any()

False

51 将每行升序排列

data.sort(axis = 1)
data

array([[28, 35, 44, 77, 79, 93],
       [33, 51, 56, 56, 56, 73],
       [29, 44, 53, 63, 71, 73],
       [25, 30, 44, 51, 87, 90],
       [ 7, 29, 39, 50, 83, 89],
       [ 8, 18, 33, 40, 64, 75]])

52 将data的数据格式修改为float

data1 = data.astype(float)

53 将小于5的元素修改为nan

data1[data1 < 5] = np.nan
data1

array([[nan, 35., 44., 77., 79., 93.],
       [33., 51., 56., 56., 56., 73.],
       [29., 44., 53., 63., 71., 73.],
       [25., 30., 44., 51., 87., 90.],
       [ 7., 29., 39., 50., 83., 89.],
       [ 8., 18., 33., 40., 64., 75.]])

54 删除data1含有nan的行

data1 = data1[~np.isnan(data1).any(axis=1), :]

data1

array([[33., 51., 56., 56., 56., 73.],
       [29., 44., 53., 63., 71., 73.],
       [25., 30., 44., 51., 87., 90.],
       [ 7., 29., 39., 50., 83., 89.],
       [ 8., 18., 33., 40., 64., 75.]])

55 找出data1第一行出现频率最高的值

vals, counts = np.unique(data1[0,:], return_counts=True)
print(vals[np.argmax(counts)])

56.0

56 找到data1中与100最接近的数字

a = 100
data1.flat[np.abs(data1 - a).argmin()]

90.0

57 data1每一行的元素减去每一行的平均值

data1 - data1.mean(axis=1, keepdims=True)

array([[-21.16666667,  -3.16666667,   1.83333333,   1.83333333,
          1.83333333,  18.83333333],
       [-26.5       , -11.5       ,  -2.5       ,   7.5       ,
         15.5       ,  17.5       ],
       [-29.5       , -24.5       , -10.5       ,  -3.5       ,
         32.5       ,  35.5       ],
       [-42.5       , -20.5       , -10.5       ,   0.5       ,
         33.5       ,  39.5       ],
       [-31.66666667, -21.66666667,  -6.66666667,   0.33333333,
         24.33333333,  35.33333333]])

58 将data1归一化至区间[0,1]

a = np.max(data1) - np.min(data1)
(data1 - np.min(data1)) / a

array([[0.31325301, 0.53012048, 0.59036145, 0.59036145, 0.59036145,
        0.79518072],
       [0.26506024, 0.44578313, 0.55421687, 0.6746988 , 0.77108434,
        0.79518072],
       [0.21686747, 0.27710843, 0.44578313, 0.53012048, 0.96385542,
        1.        ],
       [0.        , 0.26506024, 0.38554217, 0.51807229, 0.91566265,
        0.98795181],
       [0.01204819, 0.13253012, 0.31325301, 0.39759036, 0.68674699,
        0.81927711]])

59 将data1标准化

mu = np.mean(data1, axis=0)
sigma = np.std(data1, axis=0)
(data1 - mu) / sigma

array([[ 1.16268622,  1.41802672,  1.2856926 ,  0.52888589, -1.40282088,
        -0.89773106],
       [ 0.79357948,  0.82006364,  0.93504916,  1.45443618, -0.10391266,
        -0.89773106],
       [ 0.42447275, -0.3758625 , -0.11688115, -0.13222147,  1.28158945,
         1.28247294],
       [-1.23650756, -0.4612858 , -0.70128687, -0.26444294,  0.93521392,
         1.15422565],
       [-1.14423088, -1.40094206, -1.40257375, -1.58665766, -0.71006983,
        -0.64123647]])

60 将data1存储至本地

np.savetxt('test.txt',data1)

NumPy进阶修炼第四期｜NumPy最后二十问

import numpy as np
import pandas as pd
import warnings
warnings.filterwarnings("ignore")

61.如何获得两个数组之间的相同元素

输入:

arr1 = np.random.randint(10,6,6)

arr2 = np.random.randint(10,6,6)

arr1 = np.random.randint(1,10,10)
arr2 = np.random.randint(1,10,10)

print("arr1: %s"%arr1)
print("arr2: %s"%arr2)
np.intersect1d(arr1,arr2)

arr1: [9 4 1 4 9 9 8 5 3 1]
arr2: [1 5 8 7 9 2 6 9 1 2]





array([1, 5, 8, 9])

62.如何从一个数组中删除另一个数组存在的元素

输入:

arr1 = np.random.randint(1,10,10)

arr2 = np.random.randint(1,10,10)

arr1 = np.random.randint(1,10,10)
arr2 = np.random.randint(1,10,10)
print("arr1: %s"%arr1)
print("arr2: %s"%arr2)
np.setdiff1d(arr1,arr2)

arr1: [3 3 2 6 6 1 4 6 2 2]
arr2: [3 3 2 6 8 8 5 2 4 7]





array([1])

63.如何修改一个数组为只读模式

输入:

arr1 = np.random.randint(1,10,10)

arr1 = np.random.randint(1,10,10)
arr1.flags.writeable = False

#尝试修改会报错！
arr1[0] = 6

---------------------------------------------------------------------------

ValueError                                Traceback (most recent call last)

<ipython-input-31-ddcf305e5efb> in <module>
      1 #尝试修改会报错！
----> 2 arr1[0] = 6


ValueError: assignment destination is read-only

64.如何将list转为numpy数组

输入:

a = [1,2,3,4,5]

a = [1,2,3,4,5]
np.array(a)

array([1, 2, 3, 4, 5])

65.如何将pd.DataFrame转为numpy数组

输入:

df = pd.DataFrame({‘A’:[1,2,3],‘B’:[4,5,6],‘C’:[7,8,9]})

df = pd.DataFrame({'A':[1,2,3],'B':[4,5,6],'C':[7,8,9]})
print(df)
print(df.values)

66.如何使用numpy进行描述性统计分析

输入：

arr1 = np.random.randint(1,10,10)

arr2 = np.random.randint(1,10,10)

arr1 = np.random.randint(1,10,10)
arr2 = np.random.randint(1,10,10)

print("arr1的平均数为:%s" %np.mean(arr1))
print("arr1的中位数为:%s" %np.median(arr1))
print("arr1的方差为:%s" %np.var(arr1))
print("arr1的标准差为:%s" %np.std(arr1))
print("arr1,arr的相关性矩阵为:%s" %np.cov(arr1,arr2))
print("arr1,arr的协方差矩阵为:%s" %np.corrcoef(arr1,arr2))

arr1的平均数为:5.2
arr1的中位数为:5.0
arr1的方差为:6.56
arr1的标准差为:2.5612496949731396
arr1,arr的相关性矩阵为:[[7.28888889 2.6       ]
 [2.6        7.12222222]]
arr1,arr的协方差矩阵为:[[1.         0.36085682]
 [0.36085682 1.        ]]

67.如何使用numpy进行概率抽样

输入：

arr = np.array([1,2,3,4,5])

arr = np.array([1,2,3,4,5])
np.random.choice(arr,10,p = [0.1,0.1,0.1,0.1,0.6])

array([2, 5, 5, 5, 5, 4, 1, 5, 5, 5])

68.如何创建副本

输入：

arr = np.array([1,2,3,4,5])

#对副本数据进行修改，不会影响到原始数据
arr = np.array([1,2,3,4,5])
arr1 = arr.copy()

69.如何对数组切片

输入:
arr = np.arange(10)

备注：从索引2开始到索引8停止，间隔为2

arr = np.arange(10)
a = slice(2,8,2)
arr[a] #等价于arr[2:8:2]

array([2, 4, 6])

70.如何使用NumPy操作字符串

输入:

str1 = [‘I love’]

str2 = [’ Python’]

#拼接字符串
str1 = ['I love']
str2 = [' Python']
print(np.char.add(str1,str2))

#大写首字母
str3 = np.char.add(str1,str2)
print(np.char.title(str3))

['I love Python']
['I Love Python']

71.如何对数据向上/下取整

输入:

arr = np.random.uniform(0,10,10)

arr = np.random.uniform(0,10,10)
print(arr)
###向上取整
print(np.ceil(arr))
###向下取整
print(np.floor(arr) )

[3.69853424 2.37607144 2.75296734 3.98645188 9.8325098  9.78061437
 1.05052842 6.93954312 3.74869061 0.89292687]
[ 4.  3.  3.  4. 10. 10.  2.  7.  4.  1.]
[3. 2. 2. 3. 9. 9. 1. 6. 3. 0.]

72.如何取消默认科学计数显示数据

np.set_printoptions(suppress=True)

73.如何使用NumPy对二维数组逆序

输入：

arr = np.random.randint(1,10,[3,3])

arr = np.random.randint(1,10,[3,3])
print(arr)
print('列逆序')
print(arr[:, -1::-1])
print('行逆序')
print(arr[-1::-1, :])

[[5 6 2]
 [1 6 9]
 [2 7 5]]
列逆序
[[2 6 5]
 [9 6 1]
 [5 7 2]]
行逆序
[[2 7 5]
 [1 6 9]
 [5 6 2]]

74.如何使用NumPy根据位置查找元素

输入：

arr1 = np.random.randint(1,10,5)

arr2 = np.random.randint(1,20,10)

备注：在arr2中根据arr1中元素以位置查找

arr1 = np.random.randint(1,10,5)
arr2 = np.random.randint(1,20,10)
print(arr1)
print(arr2)
print(np.take(arr2,arr1))

[4 9 3 7 9]
[ 1  3 14  5 13 15 16  6  1  6]
[13  6  5  6  6]

75.如何使用numpy求余数

输入：

a = 10

b = 3

np.mod(a,b)

76.如何使用NumPy进行矩阵SVD分解

输入：

A = np.random.randint(1,10,[3,3])

np.linalg.svd(A)

(array([[-0.53080534, -0.05856788, -0.84546762],
        [-0.50084903, -0.7830816 ,  0.36869155],
        [-0.68366361,  0.61915508,  0.38633023]]),
 array([15.54841031,  7.33950585,  1.54226802]),
 array([[-0.54854452, -0.50684335, -0.66498777],
        [-0.83142704,  0.24649305,  0.49796612],
        [-0.08847596,  0.82604539, -0.55661568]]))

77.如何使用NumPy多条件筛选数据

输入：

arr = np.random.randint(1,20,10)

arr = np.random.randint(1,20,10)
print(arr[(arr>1)&(arr<7)&(arr%2==0)])

[6 4]

78.如何使用NumPy对数组分类

输入：

arr = np.random.randint(1,20,10)

备注：将大于等于7，或小于3的元素标记为1，其余为0

arr = np.random.randint(1,20,10)
print(arr)
print(np.piecewise(arr, [arr < 3, arr >= 7], [-1, 1]))

[ 8 19 16  1  4  7 12  1 16  1]
[ 1  1  1 -1  0  1  1 -1  1 -1]

79如何使用NumPy压缩矩阵

输入：

arr = np.random.randint(1,10,[3,1])

备注：从数组的形状中删除单维度条目，即把shape中为1的维度去掉

arr = np.random.randint(1,10,[3,1])
print(arr)
print(np.squeeze(arr))

[[3]
 [8]
 [5]]
[3 8 5]

80.如何使用numpy求解线性方程组

输入：

A = np.array([[1, 2, 3], [2, -1, 1], [3, 0, -1]])

b = np.array([9, 8, 3])

求解Ax = b

A = np.array([[1, 2, 3], [2, -1, 1], [3, 0, -1]])
b = np.array([9, 8, 3])
x = np.linalg.solve(A, b)
print(x)

[ 2. -1.  3.]

下载方式

为了让各位读者更方便的刷题，我已经将NumPy80题整理在Notebook中，共分为两个版本，一份无答案版可以用来刷题👇

一份有答案版本用来参考学习👇

大家可以在我的GitHub中下载(https://github.com/liuhuanshuo/zaoqi-Python/tree/master/NumPy80)，因为我每题仅给出一种解法，因此在刷题过程中也应该思考是否有不一样/更高效的方法，结合Pandas120题使用更是威力无穷！另外Python数据可视化同款专题正在准备中，敬请期待！

posted @ 2020-07-22 10:15 刘早起阅读(247) 评论(0) 收藏举报

刷新页面返回顶部

刘早起

NumPy进阶80题完整版｜附Notebook版本下载

前言

完整版80题

1.导入并查看NumPy版本

2.创建十个全为0的一维数组

3.创建10个全为0的一维数据并修改数据类型为整数

4.创建20个0-100固定步长的数

5.从list创建数组

6.创建一个三行三列全是1的矩阵

7.创建一个2行2列矩阵并且元素为布尔类型的True

8.创建等差数列

9.创建等差数列

10.创建3x3矩阵

11.创建3x3矩阵

12.将第五题的result修改为3x3矩阵

13.对上一题生成的result取转置

14.查看result的数据类型

15.查看result的内存占用

16.将result的数据类型修改为float

17.提取result第三行第三列的元素

18.将result第三行第三列的元素放大十倍

19.提取result中的所有偶数

20.将result中所有奇数修改为666

NumPy进阶修炼80题 第二期 ｜基本矩阵操作与运算

21.创建主对角线都是5的5x5矩阵

22.交换第一列与第二列

23.交换第一行与第二行

24.判断两个矩阵是否有任何元素不同(使用22,23两题得到的矩阵)

25.计算两个矩阵不同元素的个数(使用22,23两题得到的矩阵)

26.找到两个矩阵不同元素的位置(使用22,23两题得到的矩阵)

27.矩阵乘法(使用22,23两题得到的矩阵)

28.矩阵对应元素相乘(使用22,23两题得到的矩阵)

29.计算行列式(使用21题生成的矩阵)

30.矩阵求逆(使用21题生成的矩阵)

31.将22与23题生成的np.array对象修改为np.matrix对象

32.计算上一题生成的两个np.matrix格式矩阵的对应元素乘积（对比异同）

33.对31题生成的两个np.matrix格式矩阵做矩阵乘法（对比异同）

34.将两个矩阵按照行拼接

35.将两个矩阵按照列拼接

36.思考下面代码运行后new的结果

37.找到new中大于1的元素的位置

38.将new中大于1的元素修改为9

39.对new按列求和

40.对new按行求和

NumPy进阶修炼第三期｜41-60

41 生成指定格式数据

42 找到每列的最大值

43 找到每行的最小值

44 提取data每个元素的出现次数

45 获取data每行元素的大小排名

46 将数组按行重复一次

47 去除数组的重复行

48 不放回抽样

49 提取data第二行中不含第三行的元素的元素

50 判断data是否有空行

51 将每行升序排列

52 将data的数据格式修改为float

53 将小于5的元素修改为nan

54 删除data1含有nan的行

55 找出data1第一行出现频率最高的值

56 找到data1中与100最接近的数字

57 data1每一行的元素减去每一行的平均值

58 将data1归一化至区间[0,1]

59 将data1标准化

60 将data1存储至本地

NumPy进阶修炼第四期｜NumPy最后二十问

61.如何获得两个数组之间的相同元素

62.如何从一个数组中删除另一个数组存在的元素

63.如何修改一个数组为只读模式

64.如何将list转为numpy数组

65.如何将pd.DataFrame转为numpy数组

66.如何使用numpy进行描述性统计分析

67.如何使用numpy进行概率抽样

68.如何创建副本

69.如何对数组切片

70.如何使用NumPy操作字符串

71.如何对数据向上/下取整

72.如何取消默认科学计数显示数据

73.如何使用NumPy对二维数组逆序

NumPy进阶修炼80题第二期｜基本矩阵操作与运算