pandas 基础

通过列表生成series：

import pandas as pd
import numpy as np
s = pd.Series([1, 3, 5, np.nan, 6, 8])

创建dataframe格式数据

方法一：通过列表生成dateframe格式数据

b = pd.DataFrame([[1,2,3,4],[5,6,7,8]], index=['a', 'b'], columns=['A', 'B', 'C', 'D'])

方法二：通过字典生成生成dateframe格式数据

c = pd.DataFrame({'A':[1, 2, 3, 4],
                  'B':[5, 6, 7, 8]
                 }, index=['a', 'b', 'c', 'd'])

显示索引与列名：

　　df.index

　　df.columns

转成列表格式

　　df.columns.values.tolist()

df.loc[] 方法为按标签名选择

　　df.loc['行标签名1'：'行标签名2'，'列标签名1'：'列标签名2']

　　df.loc[['行标签名1', '行标签名2', '行标签名3']，['列标签名1', '列标签名2', '列标签名3']]

df.iloc 方法为按标签名选择

　　df.iloc[行号1：行号2，列号1：列号2]

　　df.iloc[[行号1：行号2]，[列号1：列号2]]

重命名：

apply函数，对dateframe每个元素遍历操作

使A列每个元素减1：

c['A'] = c.A.apply(lambda x:x-1)

使所有列每个元素减1：

c = c.apply(lambda x:x-1)

DSA

posted on 2022-04-12 17:50 兴0言阅读(9) 评论(0) 收藏举报

刷新页面返回顶部

ganyu