特征工程

 

特征初步分析

特征自身质量(完整度)

特征与目标值的相关性

 

特征处理

特征清洗

过滤

异常点检测

特征预处理

缺失值填充

归一化

离散化

平滑

降维

哑编码

 

案例

工程角度: 数据->特征

上面罗列的方法更多是从工程角度来看

业务角度: 知识->因子->特征

第一步, 找专家访谈, 深挖影响要素, 成为行业专家

第二步, 罗列因子和数据需求,

逻辑: 与天花板相关的终极制约因素

渠道, 平台类的中间因素

终端市场, 竞品, 营销/销售行为等直接因素

第三步, 做成一个反映用户需求的标签体系(量化的标签)

第四步, 构建量化的原子特征

 

posted @ 2021-08-23 11:19  Raylan  阅读(83)  评论(0)    收藏  举报