摘要: Data Transformations split(x, f, drop = FALSE, …),x是待划分的向量或数据框,f是定义了组关系的因子变量。 library(MASS) g ## [1] "list" names(g) ## [1] "USA" "non-USA" c(medi... 阅读全文
posted @ 2013-02-19 16:03 cchen 阅读(949) 评论(0) 推荐(0)
摘要: 鼠标选中多行,按下 Ctrl+Shift+L (Command+Shift+L) 即可同时编辑这些行。 鼠标选中文本,反复按 CTRL+D (Command+D) 即可继续向下同时选中下一个相同的文本进行同时编辑。 鼠标选中文本,按下 Alt+F3 (Win) 或 Ctrl+Command+G(M... 阅读全文
posted @ 2013-02-17 09:47 cchen 阅读(157) 评论(0) 推荐(0)
摘要: 字符串长度:nchar()。 连接字符串:paste()/paste0(),两个主要参数sep和collapse。 抽取子字符串:substr(string, start, end),注意坐标从1开始。 Splitting a string according to a delimiter:str... 阅读全文
posted @ 2013-02-14 19:18 cchen 阅读(377) 评论(0) 推荐(0)
摘要: $A$是可逆方阵,$u$,$v$列向量,有: $det(I+uv^T)=1+u^Tv$ $det(A+uv^T)=det(A)(1+v^TA^{-1}u)$ Proof: \begin{equation}\left(\begin{array}{cc} I & 0 \\ v^T & 1 \end{... 阅读全文
posted @ 2013-02-02 15:33 cchen 阅读(1093) 评论(0) 推荐(0)
摘要: 分类问题的两种解决方案 给定训练数据$T=\{(X_i, Y_i), i = 1, 2, 3, \ldots, N\}$,$Y$是categorical variable,假设有$K$类。分类问题就是给定sample的x去预测y,也就是学习条件概率$P(Y|X)$。一个直观的解是$\hat{k} =... 阅读全文
posted @ 2013-02-01 17:17 cchen 阅读(734) 评论(0) 推荐(0)