摘要: Python中集成R :参考博客http://blog.csdn.net/weidelight/article/details/44946785 阅读全文
posted @ 2017-12-19 22:15 caiqingfei 阅读(824) 评论(0) 推荐(0) 编辑
摘要: 转载:http://blog.163.com/qianshch%40126/blog/static/48972522201092254141315/ 聚类的目标是使同一类对象的相似度尽可能地大;不同类对象之间的相似度尽可能地小。目前聚类的方法很多,根据基本思想的不同,大致可以将聚类算法分为五大类:层 阅读全文
posted @ 2017-12-18 11:12 caiqingfei 阅读(7557) 评论(0) 推荐(0) 编辑
摘要: 分类是数据挖掘、机器学习和模式识别中一个重要的研究领域。通过对当前数据挖掘中具有代表性的优秀分类算法进行分析和比较,总结出了各种算法的特性,为使用者选择算法或研究者改进算法提供了依据。 一、分类算法概述 解决分类问题的方法很多 ,单一的分类方法主要包括:决策树、贝叶斯、人工神经网络、K-近邻、支持向 阅读全文
posted @ 2017-12-18 11:06 caiqingfei 阅读(13296) 评论(0) 推荐(1) 编辑
摘要: 数据规范化处理是数据挖掘的一项基本操作。现实中,数据中不同特征的量纲可能不一致,数值间的差别可能很大,不进行处理可能会影响到数据分析的结果,因此,需要对数据按照一定比例进行缩放,使之落在一个特定的区域,便于进行综合分析。特别是基于距离的挖掘方法,在建模前一定要对数据进行规范化处理,如SVM,KNN, 阅读全文
posted @ 2017-12-17 21:41 caiqingfei 阅读(7735) 评论(0) 推荐(0) 编辑
摘要: 下周写! 阅读全文
posted @ 2017-12-17 13:50 caiqingfei 阅读(259) 评论(0) 推荐(0) 编辑
摘要: 学习中! 阅读全文
posted @ 2017-12-17 13:49 caiqingfei 阅读(418) 评论(0) 推荐(0) 编辑
摘要: 学习中! 阅读全文
posted @ 2017-12-17 13:48 caiqingfei 阅读(380) 评论(0) 推荐(0) 编辑
摘要: 学习中! 阅读全文
posted @ 2017-12-17 13:47 caiqingfei 阅读(405) 评论(0) 推荐(0) 编辑
摘要: 现实世界中的数据总是“脏的”,主要体现在数据不准确,不完整,不一致,含有噪声和异常等,而数据清洗的目的就是尽可能的使现实中的数据变得准确,完整,一致,真实,可信。 下面逐一讨论如何对存在这些问题数据进行清理。 先从简单的开始: 一 ,数据不完整,即数据中存在缺失值,对于缺失值的处理主要有以下几种方法 阅读全文
posted @ 2017-12-17 13:46 caiqingfei 阅读(1523) 评论(0) 推荐(0) 编辑
摘要: 学习中! 阅读全文
posted @ 2017-12-17 13:46 caiqingfei 阅读(362) 评论(0) 推荐(0) 编辑