pandas 基础

 

 

通过列表生成series:

import pandas as pd
import numpy as np
s = pd.Series([1, 3, 5, np.nan, 6, 8])

 

 

创建dataframe格式数据

方法一:通过列表生成dateframe格式数据

b = pd.DataFrame([[1,2,3,4],[5,6,7,8]], index=['a', 'b'], columns=['A', 'B', 'C', 'D'])

 

 

 

 

 方法二:通过字典生成生成dateframe格式数据

c = pd.DataFrame({'A':[1, 2, 3, 4],
                  'B':[5, 6, 7, 8]
                 }, index=['a', 'b', 'c', 'd'])


 

显示索引与列名:

  df.index

  df.columns

转成列表格式

  df.columns.values.tolist()


 

df.loc[] 方法为按标签名选择

  df.loc['行标签名1':'行标签名2','列标签名1':'列标签名2']

  df.loc[['行标签名1', '行标签名2', '行标签名3'],['列标签名1', '列标签名2', '列标签名3']]

df.iloc 方法为按标签名选择

  df.iloc[行号1:行号2,列号1:列号2]

  df.iloc[[行号1:行号2],[列号1:列号2]]

 


 

重命名:

 

 

 


 

apply函数,对dateframe每个元素遍历操作

 

 使A列每个元素减1:

c['A'] = c.A.apply(lambda x:x-1)

 

 使所有列每个元素减1:

c = c.apply(lambda x:x-1)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

DSA

 

posted on 2022-04-12 17:50  兴0言  阅读(9)  评论(0)    收藏  举报