Loading

Python数据分析

编程字典

Notebook on nbviewer

Jupyter 进阶教程

Matplotlib

Reference

Matplotlib中文

Matplotlib库入门

Matplotlib库基础图表函数.pdf

Numpy

Reference

参考手册

线性代数&Numpy

Numpy的数据轴

一维数据:axis 0 = y

二维数据:axis 0= z轴 ,axis 1 = y轴(二维表格行列分别代表y轴与z轴)

三维数据:axis 0= x轴 ,axis 1= z轴,axis 2 = y

axis 0代表最外面的轴

将NumPy轴视为我们可以执行操作的方向

ndarray数组的创建

x = np.array(list/tuple, dtype=np.float32)

当np.array()不指定dtype时,NumPy将根据数据情况关联一个dtype类型

Numpy常用函数与属性

Numpy函数

Numpy属性

数据存储

一维&二维数据保存:

np.savetxt(frame, array, fmt='%.18e', delimiter=None)

  • frame : 文件、字符串或产生器,可以是.gz或.bz2的压缩文件
  • array : 存入文件的数组
  • fmt : 写入文件的格式,例如:%d %.2f %.18e
  • delimiter : 分割字符串,默认是任何空格

一维&二维数据读取:

np.loadtxt(frame, dtype=np.float, delimiter=None, unpack=False)

  • frame : 文件、字符串或产生器,可以是.gz或.bz2的压缩文件
  • dtype : 数据类型,可选
  • delimiter : 分割字符串,默认是任何空格
  • unpack :如果True,读入属性将分别写入不同变量

多维数据保存:

a.tofile(frame, sep='', format='%s')

  • frame : 文件、字符串
  • sep : 数据分割字符串,如果是空串,写入文件为二进制
  • format : 写入数据的格式

多维数据读取:

np.fromfile(frame, dtype=float, count=‐1, sep='')

  • frame : 文件、字符串
  • dtype : 读取的数据类型
  • count : 读入元素个数,‐1表示读入整个文件
  • sep : 数据分割字符串,如果是空串,写入文件为二进制

该方法需要读取时知道存入文件时数组的维度和元素类型 a.tofile()和np.fromfile()需要配合使用 可以通过元数据文件来存储额外信息

便捷文件保存:

np.save(fname, array) np.savez(fname, array)

  • fname : 文件名,以.npy为扩展名,压缩扩展名为.npz
  • array : 数组变量

便捷文件读取:

np.load(fname)

  • fname : 文件名,以.npy为扩展名,压缩扩展名为.npz

Pandas

参考手册

Pandas库入门.pdf

数据的特征分析.pdf

Series类型

Series类型由一组数据及与之相关的数据索引组成

Series代码实例

DataFrame类型

DataFrame代码实

数据类型操作

重新索引

reindex(index=None, columns=None, ...)

index:行索引

columns:列索引

fill_value:重新索引中,用于填充缺失位置的值

method:填充方法, ffill当前值向前填充,bfill向后填充

limit:最大填充量

索引类型常用方法

连接另一个Index对象,产生新的Index对象 : append(idx)

计算差集,产生新的Index对象 : diff(idx)

计算交集 : intersection(idx)

计算并集 : union(idx)

删除loc位置处的元素 : delete(loc)

在loc位置增加一个元素e : insert(loc,e)

posted @ 2021-05-30 19:57  兔子翻书  阅读(187)  评论(0)    收藏  举报