08 2020 档案

摘要:基础课程: 数据结构 线性代数 概率统计 算法 linux开发 分布式:hadoop 机器学习 嗯,就从基础开始吧! 阅读全文
posted @ 2020-08-26 13:24 墨心君子 阅读(24) 评论(0) 推荐(0)
摘要:缺失值: 平均数,众数,中位数,等等填充方式 无量纲化: 数据归一化 数据标准化 log 分类的数据:编码,哑变量的方式 特征分类:OrdinalEncoder 标签分类:LabelEncoder 哑变量方式:OnehotEncoder(一般用来处理名义变量) 连续型数据: 二值化:Binarize 阅读全文
posted @ 2020-08-26 11:18 墨心君子 阅读(25) 评论(0) 推荐(0)
摘要:提取有效特征,去除噪音对模型的影响 从业务角度出发 正则化L1 阅读全文
posted @ 2020-08-26 10:58 墨心君子 阅读(20) 评论(0) 推荐(0)