caiqingfei - 博客园

2017年12月19日

摘要： Python中集成R :参考博客http://blog.csdn.net/weidelight/article/details/44946785 阅读全文

posted @ 2017-12-19 22:15 caiqingfei 阅读(855) 评论(0) 推荐(0)

2017年12月18日

摘要：转载：http://blog.163.com/qianshch%40126/blog/static/48972522201092254141315/ 聚类的目标是使同一类对象的相似度尽可能地大；不同类对象之间的相似度尽可能地小。目前聚类的方法很多，根据基本思想的不同，大致可以将聚类算法分为五大类：层阅读全文

posted @ 2017-12-18 11:12 caiqingfei 阅读(7787) 评论(0) 推荐(0)

数据挖掘之分类算法概述与比较（转载）

摘要：分类是数据挖掘、机器学习和模式识别中一个重要的研究领域。通过对当前数据挖掘中具有代表性的优秀分类算法进行分析和比较，总结出了各种算法的特性，为使用者选择算法或研究者改进算法提供了依据。一、分类算法概述解决分类问题的方法很多，单一的分类方法主要包括：决策树、贝叶斯、人工神经网络、K-近邻、支持向阅读全文

posted @ 2017-12-18 11:06 caiqingfei 阅读(13560) 评论(0) 推荐(1)

2017年12月17日

数据挖掘之数据规范化

摘要：数据规范化处理是数据挖掘的一项基本操作。现实中，数据中不同特征的量纲可能不一致，数值间的差别可能很大，不进行处理可能会影响到数据分析的结果，因此，需要对数据按照一定比例进行缩放，使之落在一个特定的区域，便于进行综合分析。特别是基于距离的挖掘方法，在建模前一定要对数据进行规范化处理，如SVM，KNN，阅读全文

posted @ 2017-12-17 21:41 caiqingfei 阅读(7847) 评论(0) 推荐(0)

数据分析之集成算法

摘要：下周写！阅读全文

posted @ 2017-12-17 13:50 caiqingfei 阅读(266) 评论(0) 推荐(0)

数据分析之随机森林

摘要：学习中！阅读全文

posted @ 2017-12-17 13:49 caiqingfei 阅读(427) 评论(0) 推荐(0)

数据挖掘之数据规约

摘要：学习中！阅读全文

posted @ 2017-12-17 13:48 caiqingfei 阅读(410) 评论(0) 推荐(0)

数据挖掘之数据变换

摘要：学习中！阅读全文

posted @ 2017-12-17 13:47 caiqingfei 阅读(421) 评论(0) 推荐(0)

数据预处理之数据清洗

摘要：现实世界中的数据总是“脏的”，主要体现在数据不准确，不完整，不一致，含有噪声和异常等，而数据清洗的目的就是尽可能的使现实中的数据变得准确，完整，一致，真实，可信。下面逐一讨论如何对存在这些问题数据进行清理。先从简单的开始：一，数据不完整，即数据中存在缺失值，对于缺失值的处理主要有以下几种方法阅读全文

posted @ 2017-12-17 13:46 caiqingfei 阅读(1732) 评论(0) 推荐(0)

数据挖掘之数据集成

摘要：学习中！阅读全文

posted @ 2017-12-17 13:46 caiqingfei 阅读(376) 评论(0) 推荐(0)

smallji

公告