pandas 基础
通过列表生成series:
import pandas as pd import numpy as np s = pd.Series([1, 3, 5, np.nan, 6, 8])

创建dataframe格式数据
方法一:通过列表生成dateframe格式数据
b = pd.DataFrame([[1,2,3,4],[5,6,7,8]], index=['a', 'b'], columns=['A', 'B', 'C', 'D'])

方法二:通过字典生成生成dateframe格式数据
c = pd.DataFrame({'A':[1, 2, 3, 4],
'B':[5, 6, 7, 8]
}, index=['a', 'b', 'c', 'd'])

显示索引与列名:
df.index
df.columns
转成列表格式
df.columns.values.tolist()
df.loc[] 方法为按标签名选择
df.loc['行标签名1':'行标签名2','列标签名1':'列标签名2']
df.loc[['行标签名1', '行标签名2', '行标签名3'],['列标签名1', '列标签名2', '列标签名3']]
df.iloc 方法为按标签名选择
df.iloc[行号1:行号2,列号1:列号2]
df.iloc[[行号1:行号2],[列号1:列号2]]
重命名:

apply函数,对dateframe每个元素遍历操作

使A列每个元素减1:
c['A'] = c.A.apply(lambda x:x-1)

使所有列每个元素减1:
c = c.apply(lambda x:x-1)

DSA
浙公网安备 33010602011771号