机器学习-线性回归补充-实践

线性回归分析过程中可能会遇到的问题

 

选定自变量时候要注意:去除多重共线性干扰

 什么是多重共线性干扰?

强相关变量

多重共线性

避免将两个强相关变量输入到一个模型中,解决办法是只保留一个。

消除多重共线性的方法:

如果GVIF>10 则需要调整

 

如何挑选输入模型的自变量

输入的自变量多是有好处的,能够提升回归模型的准确性。另一方面,建设输入的自变量也是有好处的,可以方便业务同事理解。

权衡自变量多少的标准:

用olsrr包的ols_all_possible()函数

 

以上数据都计算出来后就可以创建线性回归模型

 

分析模型

 

 

 

posted @ 2019-06-08 16:09  我的数据之路  阅读(333)  评论(0编辑  收藏  举报