特征工程
特征初步分析
特征自身质量(完整度)
特征与目标值的相关性
特征处理
特征清洗
过滤
异常点检测
特征预处理
缺失值填充
归一化
离散化
平滑
降维
哑编码
案例
工程角度: 数据->特征
上面罗列的方法更多是从工程角度来看
业务角度: 知识->因子->特征
第一步, 找专家访谈, 深挖影响要素, 成为行业专家
第二步, 罗列因子和数据需求,
逻辑: 与天花板相关的终极制约因素
渠道, 平台类的中间因素
终端市场, 竞品, 营销/销售行为等直接因素
第三步, 做成一个反映用户需求的标签体系(量化的标签)
第四步, 构建量化的原子特征

浙公网安备 33010602011771号