Loading

0, 总览

数据挖掘的基本流程

  1. 商业理解:
  2. 数据理解:
  3. 数据准备:
  4. 模型建立:
  5. 模型评估:
  6. 上线发布:

数据挖掘的算法

分类算法 C4.5,Naive Bayes,SVM,KNN,Adaboost,CART
C4.5

决策树算法,(它创造性地在决策树构造过程中就进行了剪枝,并且可以处理连续的属性,也能对不完整的数据进行处理)

朴素贝叶斯(Naive Bayes)

基于概率论原理,(思想:对于给出的未知物体想要进行分类,就需要求解在这个未知物体出现的条件下各个类别出现的概率,哪个最大,就认为这个未知物体属于哪个分类)。

聚类算法 K-Means , EM
关联分析 Apriori
连接分析 PageRank

极客时间版权所有: https://time.geekbang.org/column/article/73397

数据挖掘的数学原理

img img img img img
posted @ 2025-03-12 22:28  一起滚月球  阅读(11)  评论(0)    收藏  举报