摘要:
基础课程: 数据结构 线性代数 概率统计 算法 linux开发 分布式:hadoop 机器学习 嗯,就从基础开始吧! 阅读全文
posted @ 2020-08-26 13:24
墨心君子
阅读(24)
评论(0)
推荐(0)
摘要:
缺失值: 平均数,众数,中位数,等等填充方式 无量纲化: 数据归一化 数据标准化 log 分类的数据:编码,哑变量的方式 特征分类:OrdinalEncoder 标签分类:LabelEncoder 哑变量方式:OnehotEncoder(一般用来处理名义变量) 连续型数据: 二值化:Binarize 阅读全文
posted @ 2020-08-26 11:18
墨心君子
阅读(25)
评论(0)
推荐(0)
摘要:
提取有效特征,去除噪音对模型的影响 从业务角度出发 正则化L1 阅读全文
posted @ 2020-08-26 10:58
墨心君子
阅读(20)
评论(0)
推荐(0)

浙公网安备 33010602011771号