dataframe常用处理

获取列名：
data.columns.values.tolist()

复制列：

out['serial_number'] = out['2']
这样就是新增了一列，复制了‘2’这一列，然后再del out['2]即可
这样的形式也可以用于把前面某些列的计算值赋到新的一列

换列名：

#给data_app赋上新的列名称
data_app.columns = ['user_id', 'hlw_all3', 'vedio_app_time', 'game_app_time', 'read_app_time', 'music_app_time', 'dm_app_time', 'toutiao_app_time']


根据某一列的值取出符合条件的所有行：

data_sp = data[data['$AS-TwoStep'] == 'Cluster-1']
该句意思为取出$AS-TwoStep这一列为cluster-1的所有数据

Python pandas.errors.ParserError: Error tokenizing data. C error: Expected 1 fields in line 121, saw 2

读取数据报这个错误时添加

delimiter="\t"，例如：

data1 = pd.read_csv(f1, low_memory=False, delimiter="\t")
就可以了

pandas导出数据时不想要序号的话就写一句  index=False就行了

读取dataframe的第N列：
df['列名']

读取dataframe的第N行：
df[行数：行数+1]
比如：读第0行   df[0:1]

将dataframe利用df.values.tolist()转化为列表时会出现大列表套小列表的情况
如果想避免这种情况，只要大列表，可以先将dataframe通过df['user_id']转化为series，然后再利用series.tolist()转化为列表，这样就只有一个大列表

想把一列中的空值全部变为0
https://blog.csdn.net/chenpe32cp/article/details/82180537



定位dateframe某行某列的一条数据：
df.iat[行，列]


dataframe处理行列
https://blog.csdn.net/kevin_7july/article/details/79377234




查看数据是否有缺失
import numpy as np 
#查看是否有数据缺失
print np.any(red.isnull()==True)

posted @ 2019-04-28 14:52 你爱谈天我爱笑阅读(821) 评论(0) 收藏举报

刷新页面返回顶部

你爱谈天我爱笑

dataframe常用处理

Python pandas.errors.ParserError: Error tokenizing data. C error: Expected 1 fields in line 121, saw 2

公告