• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
返回主页

lvzw

  • 博客园
  • 首页
  • 新随笔
  • 联系
  • 订阅
  • 管理

某保险公司参保客户分析

Table of Contents¶

  • 1  读取数据
  • 2  了解数据
    • 2.1  统计一下每一列中有多少空值
    • 2.2  查看数据中是否有重复值
    • 2.3  可视化数据查看数据分布
      • 2.3.1  看一下目标变量是否平衡
      • 2.3.2  绘制年龄分布情况
      • 2.3.3  两类样本的年龄分布
      • 2.3.4  学历情况
      • 2.3.5  查看不同的学历之间是否购买保险的人数
      • 2.3.6  不同的县级别是否购买保险的人数
    • 2.4  数据处理
      • 2.4.1  空值填充
      • 2.4.2  变量编码
    • 2.5  建模
      • 2.5.1  尝试使用最小叶节点样本数量和最小分割样本数量进行调参
      • 2.5.2  对数据进行PCA压缩

详情链接:https://nbviewer.jupyter.org/github/lvzw94/Ipynb/blob/master/保险行业案例分析.ipynb 

posted @ 2019-09-28 11:30  lvzw  阅读(190)  评论(0)    收藏  举报
刷新页面返回顶部

公告

博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3