Logistic Regression(1)
Logit是什么?
在了解logistic回归模型之前,我们需要先了解一下logit变换及其相关的一些基本概念。
probablity & odds
在统计学里,概率(Probability)和Odds都是用来描述某件事情发生的可能性的。
概率描述的是某事件A出现的次数与所有结果出现的次数之比。公式表示:
Odds指的是 事件发生的概率与事件不发生的概率之比。公式表示为:
logit变换
注意到P(A)的区间为[0,1],而Odds的取值区间为(0,+∞)。但是传统的线性回归例如:y=α1x1+α2x2+⋯+αnxn 的
左边的y(即因变量),在自变量没有区间限制时,其取值区间往往是(-∞, +∞)。因此再对Odds取对数,则可使
取值区间变换为(-∞,+∞)。这就是通常说的logit变换,表达式为log(p / (1 - p)),一般情况下记为ln(p / (1 - p))。

浙公网安备 33010602011771号