随笔分类 -  数据分析

matplotlib、numpy、pandas
摘要:numpy其他函数 import numpy as np # 数组拼接 t1 = np.arange(12).reshape((2, 6)) t2 = np.arange(12, 24).reshape((2, 6)) print(t1) print(t2) print("*"*50) print( 阅读全文
posted @ 2024-03-05 16:55 钰见梵星 阅读(22) 评论(0) 推荐(0)
摘要:numpyNaN nan(NAN,Nan):not a number表示不是一个数字 什么时候numpy中会出现nan: 当我们读取本地的文件为float的时候,如果有缺失,就会出现nan 当做了一个不合适的计算的时候(比如无穷大(inf)减去无穷大) inf(-inf,inf):infinity, 阅读全文
posted @ 2024-03-05 16:55 钰见梵星 阅读(58) 评论(0) 推荐(0)
摘要:numpy数据操作 读取数据 # numpy读取数据 ''' np.loadtxt( fname, 文件、字符串或产生器, 也可以是压缩文件 dtype=np.float, 数据类型, 可选, 即确认csv的字符串以什么数据类型读入数组中, 默认为np.float delimiter=None, 分 阅读全文
posted @ 2024-03-05 16:54 钰见梵星 阅读(27) 评论(0) 推荐(0)
摘要:numpy基础运算 import numpy as np t1 = np.array([1, 2, 3, 4, 5]) # numpy数组类型为numpy.ndarray print("type(np.array)=", type(t1)) t2 = np.array(range(6)) print 阅读全文
posted @ 2024-03-05 16:53 钰见梵星 阅读(28) 评论(0) 推荐(0)
摘要:matplotlib直方图 假设你获取了250部电影的时长(列表a中), 希望统计出这些电影时长的分布状态(比如时长为100分钟到120分钟电影的数量, 出现的频率)等信息, 你应该如何呈现这些数据? from matplotlib import pyplot as plt a=[131, 98, 阅读全文
posted @ 2024-03-03 22:11 钰见梵星 阅读(44) 评论(0) 推荐(0)
摘要:matplotlib条形图 假设你获取到了2017年内地电影票房前20的电影(列表a)和电影票房数据(列表b), 那么如何更加直观的展示该数据? from matplotlib import pyplot as plt a = ["Wolf Warrior 2", "Fast and Furious 阅读全文
posted @ 2024-03-03 22:10 钰见梵星 阅读(33) 评论(0) 推荐(0)
摘要:matplotlib散点图 假设通过爬虫你获取到了北京2016年3, 10月份每天白天的最高气温(分别位于列表a, b), 那么此时如何寻找出气温和随时间(天)变化的某种规律? from matplotlib import pyplot as plt x_3 = range(1, 32) x_10 阅读全文
posted @ 2024-03-03 22:09 钰见梵星 阅读(17) 评论(0) 推荐(0)
摘要:matplotlib折线图 假设一天中每隔两个小时的气温(℃)分别是[15,13,14.5,17,20,25,26,26,27,22,18,15], 画出对应的气温折线图 # 导入库 from matplotlib import pyplot as plt # 传入x轴和y轴数据, 是一个可迭代对象 阅读全文
posted @ 2024-03-03 22:09 钰见梵星 阅读(57) 评论(0) 推荐(0)