• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
返回主页

静悟生慧

  • 博客园
  • 首页
  • 新随笔
  • 联系
  • 订阅
  • 管理

数据预处理基本方法

  • 数据平衡
    • 为什么要对数据进行采样
    • 是否一定需要对原始数据进行采样平衡
    • 有哪些常见的采样方法
    • 能否避免采样
    • 你平时怎么用采样方法
  • 异常点处理
    • 统计方法
    • 矩阵分解方法
    • 特征值和特征向量的本质是什么
    • 矩阵乘法的实际意义
    • 密度的离群点检测
    • 聚类的离群点检测
    • 如何处理异常点
  • 缺失值处理
    • 是不是一定需要对缺失值处理
    • 直接填充方法有哪些
    • 模型插值方法有哪些?及方法的问题
    • 如何直接离散化
    • hold位填充方法有哪些
    • 怎么理解分布补全
    • random方法使用前提
    • 总结
  • 特征选择
    • 为什么要做特征选择
    • 从哪些方面可以做特征选择
    • 既然说了两个方向,分别介绍一些吧
  • 特征提取
    • 为什么需要对数据进行变换
    • 归一化和标准化之间的关系
    • 连续特征常用方法
    • 离散特征常用方法
    • 文本特征
    • 画一个最简单的最快速能实现的框架

 

 

详情见:

https://github.com/Allen15rg/Reflection_Summary

posted @ 2020-10-14 19:55  静悟生慧  阅读(520)  评论(0)    收藏  举报
刷新页面返回顶部

公告

博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3