3. Generlized Linear Models
Generlized Linear Models 广义线性模型
Linear Regression和Logistic Regression都是广义线性模型的特例
The exponential family自然指数分布族
当概率密度函数可以写成下面的形式,我们称属于自然指数分布族:
T (y) 充分统计量 sufficient statistic 一般情况下 T (y) = y
a(η) 积累量母函数log partition function
Bernoulli –> exponential family
Gaussian -> exponential family(假设σ2= 1)
构造GLM的步骤
估计θ的方法是,θ的值应该使得观察到的样本最大可能的出现(经验风险最小化)
Linear Regression
构造GLM的难点
可以看出构造GLM难点在于第一步,对y|x; θ的分布建模。
Softmax Regression
一个比较合理的假设是对y|x; θ服从多项分布(multinomial distribution)
1{True} = 1, 1{False} = 0 比如 1{2 = 3} = 0
参考资料
- [2] Coursera Machine Learning Andrew Ng
- 待续





,logistic函数是这么来的:







最小化




最大化ℓ(θ)














最大化ℓ(θ)
浙公网安备 33010602011771号