• 博客园logo
  • 会员
  • 周边
  • 新闻
  • 博问
  • 闪存
  • 众包
  • 赞助商
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
niemand-01
博客园 | 首页 | 新随笔 | 新文章 | 联系 | 订阅 订阅 | 管理

2020年12月31日

EDA常用操作3
摘要: utils操作 除了画图和基本clean up操作以外,在分析数据集的过程中还有一些基本的切片操作以及其他,在这里记录一下。 数据集来源pokemon kaggle,基本样式 # Name Type 1 Type 2 HP Attack Defense Sp. Atk Sp. Def Speed G 阅读全文
posted @ 2020-12-31 23:44 niemand-01 阅读(165) 评论(0) 推荐(0)
 
EDA基本操作2
摘要: 基本py操作 这次主要是各种图形的绘制,以及上次遗留的一些问题 默认df = pd.read_csv('xxx') 拆分年月日以及相关操作 # 拆分年,月,日,小时,分钟,秒,周 然后添加到新行 def split_date(col,df): df[col+'_year'] = df[col].dt 阅读全文
posted @ 2020-12-31 23:21 niemand-01 阅读(179) 评论(0) 推荐(0)
 
EDA常用操作1
摘要: 常用命令记录: 可能包括pandas,numpy,matplotlib,seaborn,scipy 默认数据为df = pd.read_csv() 1. 看column的数据类型 df.info() 2. 看data的简单指标:min,max,Q1,2,3,4,mean,std,count df.d 阅读全文
posted @ 2020-12-31 03:30 niemand-01 阅读(202) 评论(0) 推荐(0)
 
 

公告


博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3