ML之不同类型问题
1. 分类问题(监督学习)
1.1 分类问题简介
-
根据样本上抽取出的特征,判定其属于有限个类别中的哪一个
-
垃圾邮件识别(结果类别:1、垃圾邮件;2、正常邮件)
-
文本情感褒贬分析(结果类别:1、褒;2、贬)
-
图像内容识别(结果类别:1、喵星人;2、汪星人;3、人类;4、草泥马;5、都不是)

1.2 分类问题的描述

2. 回归问题(监督学习)
2.1 回归问题简介
-
根据数据样本上抽取出的特征,预测连续值结果
-
如预测某某票房值

2.2 回归问题的描述

2.3 线性回归
2.3.1 定义线性回归

2.3.2 定义损失函数

2.3.3 如何得到最好的权重


注意:线性回归中的凹凸函数定义和我们高数所学知识相反,知道意思就好
2.3.3.1 最小二乘法求解线性回归
- 首先定义2D样本的回归模型为:
$ E_( \omega, b)$ = $ \sum_{i=1} ^ {m} (y_{i} - b - \omega x_{i}) ^{2} $
现在需要确定 $ \beta_{0} $ 、$ \beta_{1} $,使cost function 最小,故求导 - 求导得到


令偏导数都为0


----矩阵形式

3. 回归问题与分类问题的关系
分类中:y = {1, 2,……, m}离散值
回归中: y = R
因此回归可以看成是分类问题的推广,可以看成是类别数为不可数时候的分类问题。但是不可以简单认为回归问题要比分类问题难,事实上由于回归问题的值域为整个实数域,常常更好处理。
分类问题更多的是(一定区域的一些x)对应着(一个y),而回归问题的模型更倾向于(很小区域内的x,或者一般是一个x)对应着(一个y)

浙公网安备 33010602011771号