10种常见的回归算法总结和介绍
线性回归是机器学习中最简单的算法,它可以通过不同的方式进行训练。 在本文中,我们将介绍以下回归算法:线性回归、Robust 回归、Ridge 回归、LASSO 回归、Elastic Net、多项式回归、多层感知机、随机森林回归和支持向量机。除此以外,本文还将介绍用于评估回归模型的最常用指标,包括均方误差 (MSE)、均方根误差 (RMSE) 和平均绝对误差 (MAE)。

导入库和读取数据
import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsimport hvplot.pandas%matplotlib inlinesns.set_style("whitegrid")plt.style.use("fivethirtyeight")USAhousing = pd.read_csv('../usa-housing/USA_Housing.csv')USAhousing.head()

探索性数据分析 (EDA)
下一步将创建一些简单的图表来检查数据。 进行EDA将帮助我们熟悉数据和获得数据的信息,尤其是对回归模型影响最大的异常值。
USAhousing.info()<class 'pandas.core.frame.DataFrame'>RangeIndex: 5000 entries, 0 to 4999Data columns (total 7 columns):# Column Non-Null Count Dtype--- ------ -------------- -----0 Avg. Area Income 5000 non-null float641 Avg. Area House Age 5000 non-null float642 Avg. Area Number of Rooms 5000 non-null float643 Avg. Area Number of Bedrooms 5000 non-null float644 Area Population 5000 non-null float645 Price 5000 non-null float646 Address 5000 non-null objectdtypes: float64(6), object(1)memory usage: 273.6+ KB
查看数据集的描述
完整文章:
https://avoid.overfit.cn/post/80b712f97fce48418be96916262f9f81

浙公网安备 33010602011771号