会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
墨心君子
博客园
首页
新随笔
联系
订阅
管理
08 2020 档案
数据挖掘学习之路
摘要:基础课程: 数据结构 线性代数 概率统计 算法 linux开发 分布式:hadoop 机器学习 嗯,就从基础开始吧!
阅读全文
posted @
2020-08-26 13:24
墨心君子
阅读(24)
评论(0)
推荐(0)
数据预处理
摘要:缺失值: 平均数,众数,中位数,等等填充方式 无量纲化: 数据归一化 数据标准化 log 分类的数据:编码,哑变量的方式 特征分类:OrdinalEncoder 标签分类:LabelEncoder 哑变量方式:OnehotEncoder(一般用来处理名义变量) 连续型数据: 二值化:Binarize
阅读全文
posted @
2020-08-26 11:18
墨心君子
阅读(25)
评论(0)
推荐(0)
特征工程
摘要:提取有效特征,去除噪音对模型的影响 从业务角度出发 正则化L1
阅读全文
posted @
2020-08-26 10:58
墨心君子
阅读(20)
评论(0)
推荐(0)
公告