6.逻辑回归
1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同?
逻辑回归是基于线性回归的一种分类模型,逻辑回归虽说是回归但它解决的是分类问题,在实际问题中,所研究的变量往往不全是区间变量而是顺序变量或属性变量的时候,比如对于二项分布问题,需采用逻辑回归模型解决。
线性回归解决的就是回归问题,所谓线性回归模型就是指因变量和自变量之间的关系是直线型的。而之于逻辑回归,线性回归可以处理多个变量之间相互关系。总之来说,对连续型变量做预测叫回归(线性回归),对离散型变量做预测叫分类(逻辑回归)。
2.自述一下什么是过拟合和欠拟合?
过拟合就是指把学习进行的太彻底,把样本数据的所有特征几乎都习得了,于是机器学到了过多的局部特征。简单理解就是虽然训练样本时的得到的输出和期望输出基本一致,但是样本输出和测试样本的期望输出相差却很大 。
欠拟合一般就是模型比较简单,不能准确描述数据特征。偏差很高,训练集和验证集的准确率都很低,所以也导致在对新样本进行输出后没有办法去准确的判断。
直观图例说明:
3.思考一下逻辑回归的应用场景有哪些?
前面我理解的逻辑回归由于是分类模型,因此可用于分类场景, 尤其是因变量是二分类, 比如垃圾邮件判断(是/否垃圾邮件),是否患某种疾病(是/否), 广告是否点击等场景。