pandas笔记
一个很有趣的个人博客,不信你来撩 fangzengye.com
一维
创建:pd.Series([])
多维
DataFrame(矩阵,索引,列名)
删除列drop(元素,1)
删除行drop(元素)
读取行loc[]
读取列pd.loc[:, ['']]
读取列转为列表df['列名'].values.tolist()
看列名key()
创建空列表但有列名pd.DataFrame(columns= )
表添加元素df[列名]=''
读取csv文件read_csv()
显示前几条信息print(data.head())
显示最后几条信息print(data.tail())
显示文件大概统计信息print(data.info())
显示列种类信息print(data["列名"].value_counts())
对列筛选df[df[' ']==筛选值]也可以进行多重筛选或与非
df[(df[' ']==筛选值) & (df[' ']==筛选值)]注意括号
转化为列表tolist()
DateFrame追加一行数据,先构建一个字典再appenddf = df.append({}, ignore_index=True)
保存文件to_csv()
两个表合并pd.concat([a,b],axis=看添加行还是列)
填充空缺值Features_Sales[列名] = Features_Sales[列名].fillna(Features_Sales[列名].mean())
注意左边是列
也可以用最大值最小值
排序:sort_values(by=targe_var,ascendding=)
排完序之后可能要提取前几名下标,用index
我的个人博客fangzengye.com, 欢迎来撩哦!
原文博主: 热衷开源的宝藏Boy
版权声明: 自由转载-非商用-禁止演绎-保持署名| CC BY-NC-ND 3.0
浙公网安备 33010602011771号