利用python进行数据分析——pandas与索引

 

1. pandas包括series、dataframe

Series

Series是一维的数组型对象。

Series包含了索引index和值value。比如说:

 

 

DataFrame

DataFrame是矩阵的数组表。

DataFrame既有行索引也有列索引,它可以被视为一个共享相同索引的Series的dict。比如说:

 

 

 

2. pandas的索引?

2.1 普通索引、切片索引

在这个对象中,索引可以表达为:

 

注意1:通过索引获取数据,如果获取一个值,不显示索引;如果获取多个值,显示索引。

注意2:pandas中的切片索引包含尾部,普通的python切片不包含尾部。比如:obj[0:2] 是 obj[0]、obj[1] ; obj['a':'b'] 是 obj['a']、obj['b']

 2.2 使用 loc、iloc选择数据

注意1:loc选择的是行标签;iloc选择的是整数标签;它们选择的不是0……n-1的值下标。比如说:

Q:为什么ser[ : 1]选择一条数据;ser.loc[ : 1]选择两条数据?

A:因为ser[ : 1]是切片索引,只能索引到ser[0];然而ser.loc[ : 1] 是根据行标签选择数据,将行标签为0、1的数据选择出来。

 

posted @ 2019-08-31 16:34  Daemonnnn  阅读(3244)  评论(0编辑  收藏  举报