线性回归

一元线性回归

假设对于观测对象x和y我们收集到了一批数据

我们希望找到一个一元线性函数(一个因变量y和一个自变量x)

y i = f (x i) = w x i + b

使得函数（模型）预测出来的值和原来的值的误差平方和

S = \sum i = 1 n (f (x i) - y i) 2

最小，也即是它们的欧式距离最小，这样就会有

我们定义代价函数为（这里添加系数

L (w, b) = 1 2 S = 1 2 \sum i = 1 n ( f ( x i ) - y i ) 2

所以问题变成了，寻找出

即

(w *, b *) = arg min < w, b > 1 2 \sum i = 1 n ( f ( x

因为代价函数

令

\partial L ( w , b ) \partial w = \sum i = 1 n ( w x i + b - y i ) x i

梯度下降法

梯度下降就是通过迭代，不断让函数的参数向着梯度下降的方向走一点点，不断的逼近最优解

设更新步长为

w \leftarrow w - α \partial L w

直接求解

我们也可以直接算出它的闭式解（解析解）。令上面两个偏导数等于0，就得到

w = \sum n i = 1 y i ( x i - x ¯¯¯ ) \sum x 2 i - 1 n ( \sum n

多元线性回归

多元线性回归就是具有多个自变量和一个因变量的回归模型，假设自变量x有m个特征，我们对x和y进行了n次观测，则有模型

f (x) = w 1 x 1 + w 2 x 2 + w 3 x 3 + \dots + w m x m + b

把

y = ⎡⎣⎢⎢⎢ y 1 y 2 \dots y n ⎤⎦⎥⎥⎥, x i = ⎡⎣⎢⎢⎢ x 1 x 2 \dots

那我们可以把这个方程写成向量方程的形式

f (x i) = w T x i + b

进一步的，对于所有的数据，有数据矩阵

X = ⎡⎣⎢⎢⎢ x 11

其中，每一行是一次观测，每一列是一个维度（特征）

然后，为了方便，再把常数项

w^= ⎡⎣⎢⎢⎢⎢⎢⎢ w 1 w 2 \dots w n b ⎤⎦⎥⎥⎥⎥⎥⎥, X = ⎡⎣⎢⎢⎢ x 11

则有矩阵方程

y = f (X) = X w^

则我们的优化目标就是

w^* = arg min < w^> (y - X w^) T (y - X w^)

令

L (w^) = (y - X w^) T (y - X w^) = (y - X w^) 2

对

\partial L ( w ^ ) \partial w ^ = 2 X T ( X w ^ - y )

我们的目标就是让

梯度下降法

像一元线性回归那样，有

w^\leftarrow w^- α \partial L \partial w ^

正规方程法

令

2 X T (X w^- y) = 0

则当

w^= (X T X) - 1 X T y

其实还有很多的，但是我很懒，不想写了

其实线性回归不单只可以用来拟合线性模型，还可以用来拟合多项式函数、对数函数、指数函数等等，只要通过一定的变换，把原来的问题转换成线性的问题就可以求解，本质上还是在优化一个凸函数，一个最小二乘的问题，其实也不一定是最小二乘，也可以用其他的，比如说误差绝对值，但这种东西是视情况而论的，就这样吧。

编程实现

理论理清楚了，编程就不会太难

'''
多元线性回归
'''

import numpy as np
import matplotlib.pyplot as plt

def lossf(X,w,y):
    return np.sum((y-np.dot(X,w))**2)

def init(X,y):
    if X.ndim == 1:
        X = X.reshape(X.size,1)
    if y.ndim == 1:
        y = y.reshape(y.size,1)
    #在x后面多加一列1
    X = np.c_[X,np.ones([X.shape[0],1])]
    n,m = X.shape
    w =  w = np.random.normal(1,0.1,m)
    w = w.reshape(w.size,1)
    return X,y,w

'''
使用正规方程来求
'''
def LRWithNormalEquation(x,y):
    X,y,w = init(x,y)
    inv = np.linalg.inv(np.dot(X.T,X))
    R = np.dot(X.T,y)
    w = np.dot(inv,R)
    return w

'''
通过迭代的方法来求
'''
def LRWithGradientDesc(x,y):
    #初始化
    X,y,w = init(x,y)
 
    delta = 0.001  #收敛系数
    alpha = 0.001  #学习速率
    max_step = 10000 #最大次数
    gradient = 1000
    err = 1000
    loss = []
    i = 1
    while err>delta and i < max_step:
        i += 1
        gradient = 2*np.dot(X.T,(np.dot(X,w)-y))
        w = w - alpha*gradient
        err = lossf(X,w,y)
        loss.append(err)
        print(w)
   
    plt.plot(loss)
    return w
   

def f(X,w):
    return np.dot(X,w)
    
x = np.array([0.50,0.75,1.00,1.25,1.50,1.75,1.75,2.00,
     2.25,2.50,2.75,3.00,3.25,3.50,4.00,4.25,4.50,4.75,5.00,5.50])

y = np.array([10,  26,  23,  43,  20,  22,  43,  50,  62, 50,  55,  75,  
     62,  78,  87,  76,  64,  85,  90,  98])
     
w1 = LRWithGradientDesc(x,y)
w2 = LRWithNormalEquation(x,y)

X,y,w = init(x,y)
y1 = f(X,w1)
y2 = f(X,w2)
plt.subplot(1,2,1)
plt.scatter(x,y)
plt.plot(x,y1)
plt.title(')
plt.subplot(1,2,2)
plt.scatter(x,y)
plt.plot(x,y2)

posted @ 2021-01-04 09:11 上心童鞋阅读(166) 评论(0) 收藏举报

刷新页面返回顶部

上心童鞋

线性回归

线性回归

一元线性回归

梯度下降法

直接求解

多元线性回归

梯度下降法

正规方程法

其实还有很多的，但是我很懒，不想写了

编程实现

公告