翻译Statistical Learning with Sparsity的一些笔记
(1) fraction deviance explained
回归分析中null model表示空模型,模型只有一个常量。
(2)多分类logistic回归,也称softmax,它的参数有冗余,其原因可以参见http://ufldl.stanford.edu/wiki/index.php/Softmax%E5%9B%9E%E5%BD%92中关于“Softmax回归模型参数化的特点”这一节的解释。
(3) 关于dummy variable
dummy variable称为哑变量,也称为虚拟变量。本书译为哑变量。它的具体意义见:
http://wiki.mbalib.com/wiki/%E8%99%9A%E6%8B%9F%E5%8F%98%E9%87%8F
在《The Elements of Statistical Learning with Applications in R》的251页给出了R可以将一些列转换为dummy variable。具体代表码如下:
> x=model.matrix (Salary∼.,Hitters )[,-1]
> y=Hitters$Salary
>x
这时会看到列LeagueN,DivisionW,NewLeagueN,这三个列分别来自数据集Hitters中的列:League,Division,NewLeague。与原来的列相比,这三个列分别多了N,W,N这三个字母,其原因读者可以自己思考。
重庆工商大学 计算机科学与信息工程学院 刘波
浙公网安备 33010602011771号