5.线性回归算法
1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性
回归是统计学中最有力的工具之一,机器学习监督学习算法分为分类算法、回归算法两种。分布类型为离散型,连续型。回归算法用于连续型分布,针对数值型的样本;
分类和回归的区别在于输出变量的类型:定量输出称为回归,或者说是连续变量的预测。 定型输出称为分类,或者说是离散变量预测;
关于回归分析:


关于数组和矩阵:

线性回归的机器预测和真实值也是有一定的误差;
损失函数是计算误差的大小:

统计学习的方法:

2.思考线性回归算法可以用来做什么?(大家尽量不要写重复)
预测水稻产量、肉价的季节价格波动。
3.自主编写线性回归算法 ,数据可以自己造,或者从网上获取。(加分题)
import numpy as np import pandas as pd import matplotlib.pyplot as plt f=open('./201706120062 曾嘉业(预处理后的数据).csv',encoding='utf-8') data=pd.read_csv(f) x=data['平均价格(元)'] y=data['面积'] #利用最小二乘法得到线性回归 x_mean = np.mean(x) y_mean = np.mean(y) num = 0 d = 0 for x_i , y_i in zip(x,y): num += (x_i - x_mean) * (y_i - y_mean) d += (x_i - x_mean) **2 a = num / d b = y_mean - a * x_mean y_hat =a* x+ b plt.scatter(x,y) plt.plot(x,y_hat,color='y') plt.rcParams['font.sans-serif'] = ['Microsoft YaHei'] plt.xlabel('平均价格(元)') plt.ylabel('面积') plt.show()

浙公网安备 33010602011771号