pandas 基础介绍与概览

pandas是

基于NumPy数组构建的,特别是基于数组的函数和不使用for循环的数据处理

相关联的几个库,

 

分析库 scikit-learn statsmodels

数值计算工具,NumPy


可视化图库,matplotlib


pandas是专门为
处理表格和混杂数据设计的.专注于清理数据.

 

 

基础知识:

  •   series

        它类似一个一维数组的对象,就是一组数据(各种Numpy 数据对象) 和一列数据标签(索引)形成的.仅由一组数据即可产生最简单的series.

    理解了numpy 之后就很好理解这个了. 其中ndarray 是一种多维的数组对象.

有时候理解这个概念更为重要,

 

 

Series的字符串表现形式为:索引在左边,值在右边。由于我们没有为数据指定索
引,于是会自动创建一个0到N-1(N为数据的长度)的整数型索引。你可以通过
Series 的values和index属性获取其数组表示形式和索引对象

 

 

 

 

 

pandas  构造函数能接受的各种数据

 

 

索引index 的方法和属性

 

 

 

 

pandas的isnull和notnull函数,缺失值会表示Na

posted @ 2019-12-16 17:21  Sakura_柏  阅读(189)  评论(0编辑  收藏  举报