会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
时间带着假象流淌
博客园
首页
新随笔
联系
订阅
管理
2018年10月31日
pandas数据清洗策略2
摘要: 首先,我们先要读入数据: 然后检查数据出现的问题: 1.没有表头,增加表头 2.去除重复值: df.duplicate()使用布尔数据查看数据表中是否有重复值,df.drop_duplicates(),删去重复的值 这里有两点需要说明:第一,数据表中两个条目间所有列的内容都相等时duplicated
阅读全文
posted @ 2018-10-31 15:45 时间带着假象流淌
阅读(992)
评论(0)
推荐(0)
公告