摘要:
(一)数值特征 数值特征(numerical feature),可以是连续的(continuous),也可以是离散的(discrete),一般表示为一个实数值。 例:年龄、价格、身高、体重、测量数据。 不同算法对于数值特征的处理要求不同。下文中的一些数据处理方法,因为是针对某一特征列的单调变换,所以 阅读全文
posted @ 2019-07-06 10:53
nxf_rabbit75
阅读(5147)
评论(1)
推荐(3)
摘要:
一.查看变量的缺失值(missing value,空值)个数以及所占比例 连续型数据探索 二.画频数占比分布图,查看样本在该特征值上的分布 根据连续变量的值域范围,将该变量分成10箱,就是分成10段,箱数可自由选择; 统计每一箱内样本的频数占比:该箱内样本个数/总样本个数。然后将每一箱的频数比例画出 阅读全文
posted @ 2019-07-06 09:18
nxf_rabbit75
阅读(1777)
评论(0)
推荐(0)