0, 总览
数据挖掘的基本流程
- 商业理解:
- 数据理解:
- 数据准备:
- 模型建立:
- 模型评估:
- 上线发布:
数据挖掘的算法
分类算法 C4.5,Naive Bayes,SVM,KNN,Adaboost,CART
C4.5
决策树算法,(它创造性地在决策树构造过程中就进行了剪枝,并且可以处理连续的属性,也能对不完整的数据进行处理)
朴素贝叶斯(Naive Bayes)
基于概率论原理,(思想:对于给出的未知物体想要进行分类,就需要求解在这个未知物体出现的条件下各个类别出现的概率,哪个最大,就认为这个未知物体属于哪个分类)。
聚类算法 K-Means , EM
关联分析 Apriori
连接分析 PageRank
极客时间版权所有: https://time.geekbang.org/column/article/73397
数据挖掘的数学原理

浙公网安备 33010602011771号