1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同?

逻辑回归是离散选择法模型之一,属于多重变量分析范畴,是社会学、生物统计学、临床、数量心理学、计量经济学、市场营销等统计实证分析的常用方法。例如用逻辑回归实现一个猫分类器,输入一张图片 x ,预测图片是否为猫,输出该图片中存在猫的概率结果 y。

逻辑回归假设因变量 y 服从伯努利分布,而线性回归假设因变量 y 服从高斯分布。 因此与线性回归有很多相同之处,去除Sigmoid映射函数的话,逻辑回归算法就是一个线性回归。可以说,逻辑回归是以线性回归为理论支持的,但是逻辑回归通过Sigmoid函数引入了非线性因素,可以轻松处理0/1分类问题。

 

2.自述一下什么是过拟合和欠拟合?

过拟合就是训练的时候效果很好,损失函数值可以降得很低,但是到测试数据集的时候表现就不那么好了,原因是过分依赖于现有训练数据集的特征造成的,解决方法是可以加大数据集来进行训练。比如训练识别狗的图片,输入的图片全部是泰迪的图片训练出来的模型,当图片换成金毛的照片,就会造成识别金毛不是狗的结果。

欠拟合就是测试样本的特性没有学到,或者是模型过于简单无法拟合或区分样本。拿刚才的例子来说,即使全部是用的泰迪的图片训练,训练的模型重新去识别泰迪的照片还是识别泰迪不是狗的结果。

3.思考一下逻辑回归的应用场景有哪些?

逻辑回归的应用场景:
广告点击率,是否为垃圾邮件,是否患病金融诈骗,虚假账号。这些例子都属于两个类别之间的判断。逻辑回归就是解决二分类问题的利器。