Quantitative Method 7

R7:Introduction to Linear Regression

Ⅰ、Simple Linear Regression:简单线性回归(一元)

Y:因变量,被解释变量

X:自变量,解释变量
View Code

关联因变量和自变量的常用方法是通过估计线性关系。

    描述由直线表示的两个变量之间的关系

    如果只有一个自变量,我们将该方法称为简单线性回归

    线性回归允许我们:

        检验关于两个变量之间关系的假设

        使用一个变量对另一个变量进行预测
View Code

Ⅱ、Estimating the Parameters of a Simple Linear Regression:简单线性回归参数的估计

Error term:总体的残差项

Residual:样本的残差项

E(ei) = 0
View Code

b1 = X和Y的协方差 / X的方差
View Code

 

Ⅲ、Assumptions of the Simple Linear Regression Model:简单回归模型的基本假设

假设1:线性

    因变量Y和自变量X之间满足线性关系

    另一个隐含假设是自变量X不能是随机变量

    残差图不能随时间有明显的趋势变化
View Code

假设2:同方差

同方差:所有观测值的回归残差方差相同

如果残差方差在不同观察值之间不同。然后我们将其称为异方差
View Code

假设3:独立性

观测值(每对Ys和Xs)彼此独立

这意味着回归残差在观察值之间不相关

自相关:观察值之间存在相关性

    他们不是独立的

    残差将相互关联
View Code

假设4:正态性

回归残差满足正态分布

    只有残差满足正态分布

    因变量和自变量不需要满足正态分布

    利用正态分布残差,我们可以检验关于线性回归模型的特定假设
View Code

Ⅳ、Analysis of Variance:方差分析

R^2:决定系数

在简单线性回归模型中,相关系数的平方等于决定系数
View Code

R^2只能比较两个模型哪个更好,不能说明某个模型是否靠谱,检验模型是否靠谱需要使用F检验
View Code

se越小,模型拟合的效果越好
View Code

Ⅴ、Hypothesis Testing of Linear Regression Coefficients:线性回归系数的假设检验

检验斜率是否等于某个值B1使用t检验(df = n - 2)

拒绝原假设,说明斜率显著不等于B1

当原假设是b1 = 0时,拒绝原假设代表Y与X明显相关
View Code

当自变量是哑变量时,如果斜率不能显著区别于0,则这个回归模型不能使用,自变量选择有误
View Code

自变量和因变量之间相关系数检验使用t检验(df = n - 2)

拒绝原假设说明Y和X之间线性相关
View Code

检验截距是否等于某个值B0使用t检验(df = n - 2)

拒绝原假设说明截距显著不等于B0
View Code

Ⅵ、Prediction Using Simple Linear Regression and Prediction Intervals:使用简单线性回归模型进行预测

点估计预测和区间估计预测

sf^2:estimated variance of the prediction error(预测误差的估计方差)
View Code

sf:the standard error of forecast(预测值的标准误)
View Code

预测值的预测区间
View Code

Ⅶ、Functional Forms for Simple Linear Regression:简单线性回归的函数变形

变化的百分比使用对数
View Code

通过检查以下拟合优度度量来选择正确的函数形式:

    F-统计量

    决定系数R^2

    估计的标准误差se

此外,检查残差中是否存在任何趋势变化
View Code

Summary:

 

posted @ 2022-09-27 18:56  江畔何人初见月/  阅读(111)  评论(0)    收藏  举报