ML之不同类型问题

1. 分类问题(监督学习)

1.1 分类问题简介

  • 根据样本上抽取出的特征,判定其属于有限个类别中的哪一个

  • 垃圾邮件识别(结果类别:1、垃圾邮件;2、正常邮件)

  • 文本情感褒贬分析(结果类别:1、褒;2、贬)

  • 图像内容识别(结果类别:1、喵星人;2、汪星人;3、人类;4、草泥马;5、都不是)

1.2 分类问题的描述

2. 回归问题(监督学习)

2.1 回归问题简介

  • 根据数据样本上抽取出的特征,预测连续值结果

  • 如预测某某票房值

2.2 回归问题的描述

2.3 线性回归

2.3.1 定义线性回归

2.3.2 定义损失函数

2.3.3 如何得到最好的权重

梯度下降法

注意:线性回归中的凹凸函数定义和我们高数所学知识相反,知道意思就好

2.3.3.1 最小二乘法求解线性回归

  1. 首先定义2D样本的回归模型为:
    $ E_( \omega, b)$ = $ \sum_{i=1} ^ {m} (y_{i} - b - \omega x_{i}) ^{2} $
    现在需要确定 $ \beta_{0} $ 、$ \beta_{1} $,使cost function 最小,故求导
  2. 求导得到


令偏导数都为0


----矩阵形式

3. 回归问题与分类问题的关系

分类中:y = {1, 2,……, m}离散值

回归中: y = R
因此回归可以看成是分类问题的推广,可以看成是类别数为不可数时候的分类问题。但是不可以简单认为回归问题要比分类问题难,事实上由于回归问题的值域为整个实数域,常常更好处理。

分类问题更多的是(一定区域的一些x)对应着(一个y),而回归问题的模型更倾向于(很小区域内的x,或者一般是一个x)对应着(一个y)

posted @ 2024-10-08 21:03  awei040519  阅读(27)  评论(0)    收藏  举报