ng机器学习视频笔记（四） ——logistic回归

ng机器学习视频笔记（四）

——logistic回归

（转载请附上本文链接——linhxx）

一、概述

1、基本概念

logistic回归（logistic regression），是一个分类（classification）算法（注意不是回归算法，虽然有“回归”二字），用于处理分类问题，即结果是离散的。另外，由于有固定的结果，其是监督学习算法。

例如，预测天气、预测是否通过考试等，结果是离散的值，而预测房价这种就属于“回归”算法要解决的问题，而不是分类算法解决的问题。

2、公式

现在考虑只有两种结果情况下的logistic回归，结果只有0和1两种，即预测事件是否发生，1表示发送，0表示不发生。其h函数公式如下图所示：

其中，g函数又层S型函数（sigmoid function）。易知g函数范围：0<=g(z)<=1。

函数图像如下：

h(x)=g(z)的值，表示y=1的概率。即h(x)=p(y=1|x; θ)。y=1表示事件发生。因此h函数的结果即为事件发生的概率。

由于事件只有发生和不发生两种状态，因此，事件发生+事件不发生的概率为1，即如下公式：

二、决策边界

决策边界（decision boundary）表示h(x)=0时的x的表达式。

由于h函数是表示事件发生的概率，但是事件只有发生和不发生两种情况，因此需要将预测计算的概率和最终的结果联系起来。由于概率在0~1分布，因此，可以认为当h(x)>=0.5时，y=1。即h(x)>=0.5时，预测事件发生。同理，h(x)<0.5时，预测结果是y=0，即事件不会发生。即，只有两个结果的情况下，一个结果发生的概率超过一半，则认为其会发生。

另外，由上面g(z)函数的图，可以知道，当z>=0时g(z)>=0.5，因此，z>=0时y=1。根据样本集的分布，决策边界可以分为线性的和非线性的。

三、代价函数

1、不能使用线性回归的代价函数公式

根据下图所示线性回归的代价函数，把h(x)用上面的1/(1+e^-z)带入，求出来的结果，会是一个存在非常多极小值的函数，这样的代价函数称为非凸函数（non-convex）。