Pandas_Series介绍

pandas 有两个主要的数据结构:Series和DataFrame

Series是一种类似于一维数组的对象:它由一组数据(各种Numpy数据类型)以及相关的数据标签(索引)组成

    Series 的字符串表现形式为:索引在左边,值在右边,如果未为数据制定索引,则会自动创建一个0到N-1的整数型索引,可通过values和indeex属性获取其数组表示形式和索引对象;

    当然索引也可以自己设置, 需要注意的是索引个数需要和数据个数一致,否则会报错;

 

1 from pandas import DataFrame,Series
2 import pandas as pd;
3 
4 obj = Series([74,7,-5,-3])
5 obj2 = Series([74,7,-5,-3],index=['a','b','c'])

 

 

1 #查询的时候用索引查询即可,同时保留了它本身的函数运算
2 print(obj2[['a','c']])
3 print(  obj2[obj2>0]  )
4 print(  obj2*2  )
5 #如果数据被存放在一个Python字典中,也可以直接通过字典来创建,
6 sdate ={'Ohio':3500,'Sam':2586,'Luke':1520}
7 obj3 =Series(sdate)
8 states = ['California','Ohio','Luke','kuqi']
9 obj4 =Series(sdate,index=states)

Series 还有一个重要功能是:在算术运算中会自动对齐索引的数据,同时Series的索引可以通过赋值的方式修改

obj.index=['a','b','c','d']

 

posted @ 2018-03-20 21:42  MoonSky007  阅读(83)  评论(0)    收藏  举报