一、Series panda最基本的对象

# pandas的基础
s=pd.Series([1,3,6,np.nan,44,1])#建立个简单的基本对象 类似一个一位数组
print("建立个简单的基本对象 类似一个一位数组")
print(s)
s=pd.Series([1,2,3,4,5],index=['a','b','c','d','e'])
print("命名相关的索引")
print(s)
s.name="xuhan"#series的每个对象都有一个对应的索引和名称
s.index.name="行名"#对行索引进行命名
print("对行名和整个表的名称进行相关的命名:")
print(s)
# 切片操作
print("切片操作")#按行切片
print(s[1:3])

执行结果

建立个简单的基本对象 类似一个一位数组
0     1.0
1     3.0
2     6.0
3     NaN
4    44.0
5     1.0
dtype: float64
命名相关的索引
a    1
b    2
c    3
d    4
e    5
dtype: int64
对行名和列名进行相关的命名:
行名
a    1
b    2
c    3
d    4
e    5
Name: xuhan, dtype: int64
切片操作
行名
b    2
c    3
Name: xuhan, dtype: int64

二、Dataframe

2.1创建

# dataframe 的创建
dates=pd.date_range('20160101',periods=6,name="定义的日期表")#pd中的时间序列 从20160101开始
# # print(dates)
# 第一个参数表示表内的矩阵  第二个参数是每一行的索引  第三个表示没一列的索引
df=pd.DataFrame(np.random.randn(6,4),index=dates,columns=['a','b','c','d'])
print(df)
df2=pd.DataFrame(np.arange(1,13).reshape(3,4),index=list('123'),columns=list('abcd'))
print(df2)
df=pd.DataFrame(np.arange(12).reshape(3,4))
print(df)

结果:

                   a         b         c         d
定义的日期表                                            
2016-01-01  0.776594 -0.166321  0.156607  0.576739
2016-01-02 -1.649947  1.274599  0.571282 -0.605256
2016-01-03 -1.361043  0.013429  2.148883 -0.506440
2016-01-04  1.609952  0.498063 -0.763137  1.639300
2016-01-05  0.182889  0.630330  1.221402 -0.942096
2016-01-06 -0.348916  1.339488  1.477448 -1.320836
   a   b   c   d
1  1   2   3   4
2  5   6   7   8
3  9  10  11  12
   0  1   2   3
0  0  1   2   3
1  4  5   6   7
2  8  9  10  11

2.2对Frame中数据的排序

df=pd.DataFrame(np.arange(12).reshape(3,4))
print(df)

print("输出表格内的数据")
print(df.values)#values 表示输出表内的一系列数据

print("输出对列索引的倒叙排序")
print(df.sort_index(axis=1,ascending=False))# 对列索引进行排序 就是对每一行的数据进行排序
print("输出对行索引的倒叙排序")
print(df.sort_index(axis=0,ascending=False))#0是对行索引进行排序
print("对某一行的固定排序")
print(df.sort_values(by=1,ascending=False))#按某一列进行固定的排序
print("输出表格的相关描述")
print(df.describe())#count数量 mean平均值 std标准差 min最小值

结果:

   0  1   2   3
0  0  1   2   3
1  4  5   6   7
2  8  9  10  11
输出表格内的数据
[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]]
输出对列索引的倒叙排序
    3   2  1  0
0   3   2  1  0
1   7   6  5  4
2  11  10  9  8
输出对行索引的倒叙排序
   0  1   2   3
2  8  9  10  11
1  4  5   6   7
0  0  1   2   3
对某一行的固定排序
   0  1   2   3
2  8  9  10  11
1  4  5   6   7
0  0  1   2   3
输出表格的相关描述
         0    1     2     3
count  3.0  3.0   3.0   3.0
mean   4.0  5.0   6.0   7.0
std    4.0  4.0   4.0   4.0
min    0.0  1.0   2.0   3.0
25%    2.0  3.0   4.0   5.0
50%    4.0  5.0   6.0   7.0
75%    6.0  7.0   8.0   9.0
max    8.0  9.0  10.0  11.0