2016年10月22日

多特征数据预处理的一种尝试

摘要: 在一个实例中,有近60个特征,上千组数据样本。考虑到数据受噪声污染可能比较严重,希望能首先筛除部分不合理数据,也就是仅采用高度集中区域的数据。那么,问题就是,如何找到数据高度集中区域。找到数据密集区,数据之间的规律性更强,更利于接下来的识别。 首先考虑到的就是抽样,或者美其名曰蒙特卡洛抽样。这是一种 阅读全文

posted @ 2016-10-22 10:36 cwzhit 阅读(583) 评论(0) 推荐(0)

导航