pandas数据结构和介绍第一天

 

 

pandans另种主要的数据结构Series和DateFranme

1,Series

仅由一组数据就而已产生简单的Series

    2)Series 有index和values属性,表达索引对象

   

  3)设置索引和取值

  

  

  4)把数据存放到字典,也可以通过字典建立Series

  

 

 

DataFrame

  1,是一种表格行的数据结构,它包含一组有序的列,既有行索引也有列索引,

  

  2,指定顺序排列 用columns

    

  3,取值是可Series取值一样,这边多啦一个ix取值方式,主要是安装列索引来取值,赋值

    

    

 

  4,

     

·  4.DateFrame取值方式 切片,ix,reindex,xs,icol,irow,get_value,set_value

 

  5,xs取值需要注意下

    

 

   

 

 三:算术运算和数据对齐

  pandas最重要的一个功能是,它可以对不同索引的对象进行算术运算,在将对象相加时,如果存在不同的索引是,则结果的索引就是该索引对的并集

  

   Data相加,如果是nan可以设置为填充值  fill_value,需要用到算法add相加,sub减法,div除fa,mul乘法

  

  

  四  Series和DataFrane之间的 运算

  比如计算差值

  

  

 

  

  

  五:函数的应用和映射,apply方法 lambsa

  

 

  

六,排序和排名  sort_index  order  按字典左右排序可以用sort_index  按值排序可以order,DateFaemr里面sort_index(by=’‘),,,

  排名rank

  

  

  按值进行排序  如果是缺失值,会被放到最后

  DataFrame 可以根据一个或者多个列中的值进行排序,讲一个或多个列的名字传递给by选项即可达到目标

  

 

  排名  rank

  命名是用于破坏平衡关系的method的选项

  aVerage   默认,在相等分组中,为各值分配平均排名

  min  使用整个分组的最小排名

  max 使用整个分组的最大排名

  first 按值在原始数据中出现顺序分配排名

 

  

 

七,带有重复值的轴索引

  is_unique用于检查是不是唯一性,,pandas用于判断是有缺失值 pd.isnull(数据名),notnull(数据名),而Series判断则是   数据名。isnull()

  

 

 

    

 

  

 

  

 

  

 

 

 

  

    

 

  

 

 

  

 

 

    

 

posted @ 2018-03-03 18:44  冰滴的眼泪  阅读(244)  评论(0编辑  收藏  举报