Python数据分析
Matplotlib
Reference
Numpy
Reference
Numpy的数据轴
一维数据:axis 0 = y轴
二维数据:axis 0= z轴 ,axis 1 = y轴(二维表格行列分别代表y轴与z轴)
三维数据:axis 0= x轴 ,axis 1= z轴,axis 2 = y轴
axis 0代表最外面的轴
将NumPy轴视为我们可以执行操作的方向
ndarray数组的创建
x = np.array(list/tuple, dtype=np.float32)
当np.array()不指定dtype时,NumPy将根据数据情况关联一个dtype类型
Numpy常用函数与属性
数据存储
一维&二维数据保存:
np.savetxt(frame, array, fmt='%.18e', delimiter=None)
frame: 文件、字符串或产生器,可以是.gz或.bz2的压缩文件array: 存入文件的数组fmt: 写入文件的格式,例如:%d %.2f %.18edelimiter: 分割字符串,默认是任何空格
一维&二维数据读取:
np.loadtxt(frame, dtype=np.float, delimiter=None, unpack=False)
frame: 文件、字符串或产生器,可以是.gz或.bz2的压缩文件dtype: 数据类型,可选delimiter: 分割字符串,默认是任何空格unpack:如果True,读入属性将分别写入不同变量
多维数据保存:
a.tofile(frame, sep='', format='%s')
frame: 文件、字符串sep: 数据分割字符串,如果是空串,写入文件为二进制format: 写入数据的格式
多维数据读取:
np.fromfile(frame, dtype=float, count=‐1, sep='')
frame: 文件、字符串dtype: 读取的数据类型count: 读入元素个数,‐1表示读入整个文件sep: 数据分割字符串,如果是空串,写入文件为二进制
该方法需要读取时知道存入文件时数组的维度和元素类型 a.tofile()和np.fromfile()需要配合使用 可以通过元数据文件来存储额外信息
便捷文件保存:
np.save(fname, array) np.savez(fname, array)
fname: 文件名,以.npy为扩展名,压缩扩展名为.npzarray: 数组变量
便捷文件读取:
np.load(fname)
fname: 文件名,以.npy为扩展名,压缩扩展名为.npz
Pandas
Series类型
Series类型由一组数据及与之相关的数据索引组成
DataFrame类型


数据类型操作
重新索引
reindex(index=None, columns=None, ...)
index:行索引
columns:列索引
fill_value:重新索引中,用于填充缺失位置的值
method:填充方法, ffill当前值向前填充,bfill向后填充
limit:最大填充量
索引类型常用方法
连接另一个Index对象,产生新的Index对象 : append(idx)
计算差集,产生新的Index对象 : diff(idx)
计算交集 : intersection(idx)
计算并集 : union(idx)
删除loc位置处的元素 : delete(loc)
在loc位置增加一个元素e : insert(loc,e)

浙公网安备 33010602011771号