Pandas处理数据中常用的命令及方法
首先导入必要的包
import numpy as np
import pandas as pd
1,拉取数据
eg:l_sql = "select * from item_t"
df = pd.read_sql(l_sql,conn,index_col=None) #其中conn为数据库连接,index_col=None表示不从数据中产生index
2,重命名DataFrame的列名
df.rename(index=str,columns={'MST01':'Item','DAT':'Date','MST08':'Qty','BSUPPLY':'Type'},inplace=True) #重命名df的指定列
3,选择DataFrame的数据


选择数据:df1=df.loc[df['Name']=='Jack',:] loc按照行号和列名进行选择数据,例子中表示选择Name为Jack的所有列
更新数据:df.loc[df['Name']=='Jack',['YuWen']] = 70 表示更新Name为Jack,列名为‘YuWen’的数值为70
至于删除数据,直接可以选择出来,重新赋值一个DataFrame就可以了
4,重新定义index
df = df.reset_index() #可以重新定义index,并且把原先的index作为DataFrame的一列
5,数据的串联(SQL左右连接)
df6 = pd.merge(df4,df5,how='left',on='Item')
6,数据的拼接合并,如两份数据有相同的列名,需要合并,可以使用下面的命令
df1.append(df2)
posted on 2019-07-08 16:21 SmartTony_07 阅读(288) 评论(0) 收藏 举报
浙公网安备 33010602011771号