Pandas入门——Series基本操作

Series学习

使用Python的列表创建Series:

import numpy as np
import pandas as pd
# 使用list创建
s1 = pd.Series([1,2,3,4]) # 可以发现索引index默认从0开始进行自动索引
s1
0    1
1    2
2    3
3    4
dtype: int64

 

# 值属性,可以方便查看Series的值
s1.values
array([1, 2, 3, 4], dtype=int64)

 

# 索引index属性,返回的是索引从开始到结束和间隔的值
s1.index 
RangeIndex(start=0, stop=4, step=1)


# 使用numpy的数组进行创建
s2 = pd.Series(np.arange(10)
s2
0    0
1    1
2    2
3    3
4    4
5    5
6    6
7    7
8    8
9    9
dtype: int32
 

# 通过字典进行创建
s3 = pd.Series({'1':1, '2':2, '3':3})
s3
1    1
2    2
3    3
dtype: int64
 
s3.values
array([1, 2, 3], dtype=int64)

s3.index
Index(['1', '2', '3'], dtype='object')

 
# 手动赋值索引
s4 = pd.Series([1,2,3,4], index=['A','B','C','D'])
s4
A    1
B    2
C    3
D    4
dtype: int64

 
s4.values
array([1, 2, 3, 4], dtype=int64)

s4.index
Index(['A', 'B', 'C', 'D'], dtype='object')

s4['A']  # 根据索引取值
1

s4[s4>1] # 根据值得范围取值
B    2
C    3
D    4
dtype: int64

 
s4.to_dict() # 把Series转换为字典输出,也就是说可以通过字典创建Series,也可以通过Series转换为字典
{'A': 1, 'B': 2, 'C': 3, 'D': 4}

 
s5 = pd.Series(s4.to_dict()) # 来回转
s5
A    1
B    2
C    3
D    4
dtype: int64

 
index_1 = ['A','B','C','D','E'] # 可单独把索引写出,再赋值给Series,同时多增加一个索引
s6 = pd.Series(s5, index=index_1)
s6  # 多增加的索引的值为NAN
A    1.0
B    2.0
C    3.0
D    4.0
E    NaN
dtype: float64


pd.isnull(s6) # 根据pd.isnall()判断Series的元素是否有空值,如果有返回Ture,反之False
A    False
B    False
C    False
D    False
E     True
dtype: bool

 
pd.notnull(s6) # 类似的操作 
A     True
B     True
C     True
D     True
E    False
dtype: bool

 
s6.name = 'demo' # 给Series赋予名字
s6
A    1.0
B    2.0
C    3.0
D    4.0
E    NaN
Name: demo, dtype: float64

 

s6.index.name = 'demo_index' # 给索引起个名字
s6
demo_index
A    1.0
B    2.0
C    3.0
D    4.0
E    NaN
Name: demo, dtype: float64

 
s6.index 
Index(['A', 'B', 'C', 'D', 'E'], dtype='object', name='demo_index')

 

 

posted @ 2020-02-24 00:00  陈畅  阅读(1679)  评论(0编辑  收藏  举报