数据分析python常用的类库

1.IPython——科学计算标准工具集的组成部分

(1)是一个增强Python shell,目的是提高编写,测试,调试python的速度

 (2)主要用于交互式数据并行处理,是分布式计算的基础架构

 (3) 提供了一个类似于Mathematica的HTML笔记本,一个基于Qt框架的GUI控制台,具有绘图、多行编辑以及语法高亮。

2.Numpy数据分析——科学计算的基础包

(1)快速高效多维的数组对象ndarray

 (2)对数组执行元素级的计算以及直接对数组执行数学运算的函数

(3)读写硬盘上基于数组的数据集的工具

(4)线性代数运算,傅里叶变换,以及随机数生成

(5)将C、C++、Fortran代码集成到python

3.scipy——专门解决科学计算中各种标准问题域的模块的集合

SciPy 主要包含了 8 个模块,不同的子模块有不同的应用,如插值、积分、优化、图像处理和特殊函数等。
 scipy.integrate 数值积分例程和微分方程求解器
 scipy.linalg 扩展了由 numpy.linalg 提供的线性代数例程和矩阵分解功能
 scipy.optimize 函数优化器(最小化器)以及根查找算法
 scipy.signal 信号处理工具
 scipy.sparse 稀疏矩阵和稀疏线性系统求解器
 scipy.special SPECFUN(这是一个实现了许多常用数学函数的 Fortran 库)的包装器
 scipy.stats 检验连续和离散概率分布、各种统计检验方法,以及更好的描述统计法
 scipy.weave 利用内联 C++代码加速数组计算的工具

4. Pandas——数据分析核心库

提供了一系列能够快速、便捷地处理结构化数据的数据结构和函数。
 高性能的数组计算功能以及电子表格和关系型数据库(如 SQL)灵活的数据处理功能。
 复杂精细的索引功能,以便便捷地完成重塑、切片和切块、聚合及选取数据子集等操作。

5.Matplotlib——绘制数据图表的python库

Python的2D绘图库,非常适合创建出版物上用的图表。
 操作比较容易,只需几行代码即可生成直方图、功率谱图、条形图、错误图和散点图等图形。
 提供了pylab的模块,其中包括了NumPy和pyplot中许多常用的函数,方便用户快速进行计算和绘图。
 交互式的数据绘图环境,绘制的图表也是交互式的

6.Scikit-learn ——数据挖掘和数据分析工具

简单有效,可以供用户在各种环境下重复使用。
 封装了一些常用的算法方法。
 基本模块主要有数据预处理、模型选择、分类、聚类、数据降维和回归 6 个,在数据量不大的情况下,scikit-learn可以解决大部分问题。

7.Spyder——交互式python语言开发环境

提供高级的代码编辑、交互测试和调试等特性。
 包含数值计算环境。
 可用于将调试控制台直接集成到图形用户界面的布局中。
 模仿MATLAB的“工作空间”,可以很方便地观察和修改数组的值。

 

posted @ 2018-08-08 09:23  Element_01  阅读(4384)  评论(0编辑  收藏  举报