02 Deep learning神经网络的编程基础逻辑回归--吴恩达 - 教程

逻辑回归

逻辑回归是一种用于解决二分类任务依据线性回归的变体输出概率值，并启用Sigmoid函数将线性结果映射到[0,1]区间。就是（如预测是否是猫咪等）的统计学习方式。尽管名称中包含“回归”，但其本质

以猫咪预测为例

假设单个样本/单张图片为（ $\mathbf{x}$ ， $\mathbf{y}$ ），特征向量X = $\mathbf{x}$ ，则 $\hat{y}$ 即为X的预测值， $\hat{y}$ =P（y= $\mathbf{y}$ / $\mathbf{x}$ ）, $\hat{y}$ ∈（0,1）。
假设特征权重参数为 $\mathbf{w}$ ，是一个n_x维的向量，则有：
$\hat{y}$ = $\sigma$ （ $w^\top$ $\mathcal{x}$ + $\mathcal{b}$ ）
$\mathcal{z}$ = $w^\top$ $\mathcal{x}$ + $\mathcal{b}$
$\hat{y}$ = $\sigma（z）$

Sigmoid函数

Sigmoid函数是一种常用的S型激活函数，数学表达式为：
$\sigma(z) = \frac{1}{1 + e^{-z}}$
在这里插入图片描述
机器学习便是学习参数 $\mathcal{x}$ 和 $\mathcal{b}$ ，使得 $\hat{y}$ 尽可能接近实际值 $\mathcal{y}$ 。

符号惯例介绍

定义一个额外特征向量 $\mathcal{x_0}$ =1，
$\hat{y}$ = $\sigma$ ( $\theta^{T}$ $\mathcal{x}$ )，其中 $\theta_0$ 充当 $\mathcal{b}$ ，其余 $\theta_1$ 到 $\theta_{nx}$ 充当 $\mathbf{w}$

核心特性

输出范围：$ (0,1) $，适合概率映射
单调性：全程可导且导数最大值为$ 0.25 $（出现在$ x=0$处）
导数特性： $\sigma'(x) = \sigma(x)(1 - \sigma(x))$ ，便于梯度计算

Python实现

import numpy as np def sigmoid(x): return 1 / (1 + np.exp(-x) ) # 支持向量化计算 print(sigmoid(np.array([-1.0 , 0.0 , 1.0] ) ) ) # 输出：[0.2689, 0.5, 0.7311]

典型应用

逻辑回归中的概率转换
神经网络隐藏层的激活函数
强化学习中的动作选择概率

局限说明

深层网络易出现梯度消失（导数值随网络深度指数衰减）
输出不以零为中心可能影响优化效率
现多被ReLU系列函数替代用于隐藏层

posted on 2025-07-14 15:34 ljbguanli 阅读(3) 评论(0) 收藏举报

02 Deep learning神经网络的编程基础 逻辑回归--吴恩达 - 教程