会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Loading
pgCai
博客园
首页
新随笔
联系
订阅
管理
2019年4月29日
数据分布vs聚类-数据预处理技巧-对数变换
摘要: 对于原始数据分布倾斜 利用统计或数学变换来减轻数据分布倾斜的影响。使原本密集的区间的值尽可能的分散, 原本分散的区间的值尽量的聚合。 Log变换通常用来创建单调的数据变换。它的主要作用在于帮助稳定方差,始终保持分布 接近于正态分布并使得数据与分布的平均值无关。 y=logc(1+λx) λ通常设置为
阅读全文
posted @ 2019-04-29 11:37 pgCai
阅读(602)
评论(0)
推荐(0)
公告