吴恩达神经网络和深度学习——神经网络的编程基础

一、逻辑回归(Logistic Regression)

1. 符号定义：

y：表示输出结果，取值为(0，1)
(x⁽ⁱ⁾，y⁽ⁱ⁾)：表示第i
X=[x⁽¹⁾,x⁽²⁾,x⁽³⁾,...,x^(m)]：表示所有的训练数据集的输入值，放在一个 n_x x m
Y=[y⁽¹⁾,y⁽²⁾,y⁽³⁾,...,y^(m)]：表示所有的训练数据集的输出值，放在一个 1 x m

　　用一对(x，y)

3. 代价函数（Cost Function）

用于训练参数w和b，单个的代价函数用Loss function表示，线性回归一般使用平方误差函数，逻辑回归一般不适用，因为平方误差是非凸函数。

非凸函数在使用梯度下降算法时，容易得到局部最小值，而不是全局最优化。

对单个样本逻辑回归使用熵函数：

4. 梯度下降

反向传播过程：

梯度下降算法表示为

J=0; dw1=0; dw2=0; db=0;
for i = 1 to m
    z(i) = wx(i)+b;
    a(i) = sigmoid(z(i));
    J += -[y(i)log(a(i))+(1-y(i)）log(1-a(i));
    dz(i) = a(i)-y(i);
    dw1 += x1(i)dz(i);
    dw2 += x2(i)dz(i);
    db += dz(i);
J /= m;
dw1 /= m;
dw2 /= m;
db /= m;

6. 向量化梯度输出vectorization

Z = np.dot(w.T,X) + b
A = sigmoid(Z)
dZ = A-Y
dw = 1/m*np.dot(X,dZ.T)
db = 1/m*np.sum(dZ)

w = w - alpha*dw
b = b - alpha*db

posted @ 2023-02-24 10:55 forever_fate 阅读(84) 评论(0) 收藏举报

刷新页面返回顶部