用Python进行数据分析(4)

#定性变量写入C()中,reference表示参照水平
lm = ols("wt ~ mpg + C(vs,Treatment(reference=0))").df).fit()
lm.summary()
# 还可以对因变量进行非线性变化
lm = ols("np.log(wt) ~ mpg + C(vs,Treatment(reference=0))",df).fit()
lm.summary()
  • Logistic 回归
  1. y 是0-1变量,服从二项分布
  2. 所以需要寻找一个函数映射到 [0,1] 区间
  3. 指定函数:
logit = glm("vs ~ mpg + C(am,Treatment(reference=0))",df,families=sm.families.Binomial()).fit()
logit.summary()

 

posted @ 2022-08-22 09:56  |Simon|  阅读(82)  评论(0)    收藏  举报