上一页 1 2 3 4 5 6 ··· 40 下一页
摘要: 本文讲解如何使用R语言中e1071包中的SVM函数进行分类操作,并以一个关于鸢尾花分类的实例演示具体分类步骤。 阅读全文
posted @ 2017-05-20 21:21 穆晨 阅读(2071) 评论(0) 推荐(0) 编辑
摘要: 这部分也许是数据预处理最为关键的一个阶段。 如何对数据降维是一个很有挑战,很有深度的话题,很多理论书本均有详细深入的讲解分析。 本文仅介绍主成分分析法(PCA)和探索性因子分析法(EFA),并给出具体的实现步骤。 阅读全文
posted @ 2017-05-20 21:04 穆晨 阅读(5106) 评论(0) 推荐(1) 编辑
摘要: 在进行缺失,异常处理之后,往往要对数据进行变换。 变换有多种情况,主要是以下两种: - 规范化:对数据进行一定比例的缩放,让它实质落入某个具体区间。 - 离散化:将连续型数据转化为离散化。 阅读全文
posted @ 2017-05-20 20:38 穆晨 阅读(904) 评论(0) 推荐(0) 编辑
摘要: 数据中如果有某个值偏离该列其他值比较离谱,那么就有可能是一个异常的值。在数据预处理中,自然需要把这个异常值检测出来,然后剔除掉,或者光滑掉,或者其他各种方法进行处理。 需要注意的是,本文仅介绍最为基础的单维度异常检测及处理方法,而在实际应用中更多用到的是多维度异常检测,这部分得到时结合具体项目学习。 阅读全文
posted @ 2017-05-20 20:32 穆晨 阅读(2746) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 ··· 40 下一页