Pandas_Series介绍
pandas 有两个主要的数据结构:Series和DataFrame
Series是一种类似于一维数组的对象:它由一组数据(各种Numpy数据类型)以及相关的数据标签(索引)组成
Series 的字符串表现形式为:索引在左边,值在右边,如果未为数据制定索引,则会自动创建一个0到N-1的整数型索引,可通过values和indeex属性获取其数组表示形式和索引对象;
当然索引也可以自己设置, 需要注意的是索引个数需要和数据个数一致,否则会报错;
1 from pandas import DataFrame,Series 2 import pandas as pd; 3 4 obj = Series([74,7,-5,-3]) 5 obj2 = Series([74,7,-5,-3],index=['a','b','c'])
1 #查询的时候用索引查询即可,同时保留了它本身的函数运算 2 print(obj2[['a','c']]) 3 print( obj2[obj2>0] ) 4 print( obj2*2 ) 5 #如果数据被存放在一个Python字典中,也可以直接通过字典来创建, 6 sdate ={'Ohio':3500,'Sam':2586,'Luke':1520} 7 obj3 =Series(sdate) 8 states = ['California','Ohio','Luke','kuqi'] 9 obj4 =Series(sdate,index=states)
Series 还有一个重要功能是:在算术运算中会自动对齐索引的数据,同时Series的索引可以通过赋值的方式修改
obj.index=['a','b','c','d']

浙公网安备 33010602011771号