机器学习算法基本型 引言(笔记)

 

概念分类

我们常说的人工智能、机器学习、深度学习,他们的关系是什么?如何演进的?

image

 

image

 数据分析技术介绍

数据分析,大体上可以分成两类:统计回归和机器学习。统计回归,主要有OLS线性回归、Logistic回归等方法。在机器学习领域,主要使用的方法有聚类(K-means)、分类(J48决策树)、关联分析(MBA)、链接挖掘(Pagerank)、神经网络(NN)、贝叶斯网络(Bayes Net)。学习数据分析,主要是为了进行推理、解释、沟通和探索,具体一共是7大用途:REDCAPE(推理Reason、解释Explain、设计Desigh、沟通Communicate、行动Act、预测Predict、探索Explore)。

1、回归的主要目的是:通过研究一系列的自变量,分析事件发生的概率,了解哪个因素是影响最大的。分析的是 因果与概率,从而进行设计和沟通。做决策,用回归。比如logistic,分析哪些因素会让术后有些病人感染,有些不会感染,哪些因素会让有的客户流失,有的不流失?logistic和OLS最大的区别,是因变量,是2选1的。logistic因变量只有 是/否。重在从具体现象推一般规律,是一种归纳的思维方式。而OLS则是通过一系列自变量的演化,得到某个数据的平均值,比如房价,销售额等。重在从一般规律推具体现象,是一种演绎的思维方式。具体可以参看如下表格:

image

 2、机器学习的主要目的是:从数据中自动发现规律并构建模型,以对未来进行预测或对复杂模式进行识别。是为了实现预测和识别,从而进行自动化和优化。做提升准确率的预测,比如图像识别等,用机器学习。

image

 

 机器学习中,数据分析的整体流程如下:

image

 

posted @ 2026-01-15 11:41  1234roro  阅读(0)  评论(0)    收藏  举报