5.线性回归算法

1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性

 

回归是统计学中最有力的工具之一,机器学习监督学习算法分为分类算法、回归算法两种。分布类型为离散型,连续型。回归算法用于连续型分布,针对数值型的样本;

分类和回归的区别在于输出变量的类型:定量输出称为回归,或者说是连续变量的预测。 定型输出称为分类,或者说是离散变量预测;

关于回归分析:

 

 

 

 关于数组和矩阵:

线性回归的机器预测和真实值也是有一定的误差;

损失函数是计算误差的大小:

 

 统计学习的方法:

 

 

 

 

2.思考线性回归算法可以用来做什么?(大家尽量不要写重复)

 

预测水稻产量、肉价的季节价格波动。

 

3.自主编写线性回归算法 ,数据可以自己造,或者从网上获取。(加分题)

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

f=open('./201706120062 曾嘉业(预处理后的数据).csv',encoding='utf-8')
data=pd.read_csv(f)

x=data['平均价格(元)']
y=data['面积']
#利用最小二乘法得到线性回归
x_mean = np.mean(x)
y_mean = np.mean(y)

num = 0
d = 0
for x_i , y_i in zip(x,y):
    num += (x_i - x_mean) * (y_i - y_mean)
    d += (x_i - x_mean) **2
    a = num / d
    b = y_mean - a * x_mean
    y_hat =a* x+ b

plt.scatter(x,y)
plt.plot(x,y_hat,color='y')
plt.rcParams['font.sans-serif'] = ['Microsoft YaHei']
plt.xlabel('平均价格(元)')
plt.ylabel('面积')
plt.show()

 

 

posted @ 2020-04-21 21:24  Chaiyeh  阅读(200)  评论(0)    收藏  举报