数据计算和分析
一、Numpy(科学计算)
1、概述
1、概念
Numpy 是一个专门用于矩阵化运算、科学计算的开源Python
NumPy将Python相当于变成一种免费的更强大的Matlab系统
1、强大的 ndarray 多维数组结构
2、成熟的函数库
3、用于整合C/C++和Fortran代码的工具包
4、实用的线性代数、傅里叶变换和随机数模块
5、Numpy和稀疏矩阵运算包scipy 配合使用非常方便
2、基本数据结构
矩阵表示:使用Numpy,易得到二维矩阵
作为ndarray对象里的数据有时并不是所需要的,那么可以使用ndarray对象的astype() 方法转为指定的数据类型
2、使用
1、加载包
使用jupyter
运行当前行即可,不用从头到尾执行
新建文件夹开始使用
2、索引
将数据转为ndarray对象后,会需要按某种方式来抽取数据
ndarray对象提供了三种索引方式:
1、切片索引:切片索引和对列表list的切片索引相似,不过由原本的一维切片变为多维
2、下标索引,看成xy轴,通过坐标点获取
3、布尔值索引
二、Pandas(数据分析)
1、概念
pandas提供了使我们能够快速便捷地处理结构化数据的大量数据结构和函数
pandas兼具NumPy高性能的数组计算功能以及电子表格和关系型数据库灵活的数据处理功能
2、使用
1、导包
2、Series
Series是一种类似于一维数组的对象,由数据(各种NumPy数据 类型)以及与之相关的数据标签(即索引)组成
可以通过字典构建Series对象,Series对象的索引也是可以修改的
3、Dataframe
DataFrame是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔值等)
DataFrame既有行索引也有列索引,可以看做由Series组成的字典
drop
布尔索引
计算方法汇总
文件读写
数据处理
4、绘图
从官网查看
柱状图
饼图
子图
5、jupyter notebook 导出 markdown文件格式
安装相关包
pip install nbconvert
pip install pandoc
使用方法
在jupyter notebooks新建命令行
jupyter nbconvert --to FORMAT notebook.ipynb
执行完毕在pycharm查看,文件和文件夹拖到桌面就可以用typora打开了