03 2021 档案

缺失值处理
摘要:算法:随机森林、XGboost可以接受数据部分属性存在缺失值,解决方法: 通用方法: 1、补一个值:常见的是补中位数、均值等; 2、使用模型预测缺失值; 3、直接忽略,将缺失作为一种信息给模型学习; RF: 1、使用中位数替换:快速简单但效果差; 2、引入权重,计算对应向量与其他数据之间的相似度,计 阅读全文

posted @ 2021-03-17 19:53 Qian1996 阅读(480) 评论(0) 推荐(0)

用户画像-1
摘要:1、什么是用户画像? 用户画像是对用户特征数据的一种建模模型,通过调研、数据挖掘了解用户,洞察用户,基于不同需求目标,将他们分为不同的类型,并对每种特征属性进行抽象,归纳,产出用户特有的特征标签,帮助业务更好的理解用户。 总结一句话:用户数据特征标签化。 2、数据标签化 基于数据的不同类别可以大致划 阅读全文

posted @ 2021-03-12 14:05 Qian1996 阅读(411) 评论(0) 推荐(0)