R语言 - 随笔分类 - 地表最强队队员

R语言实战读书笔记(十三)广义线性模型

摘要：# 婚外情数据集data(Affairs, package = "AER")summary(Affairs)table(Affairs$affairs)# 用二值变量，是或否Affairs$ynaffair[Affairs$affairs > 0] |z|) (Intercept) 1.... 阅读全文

posted @ 2015-12-04 16:44 地表最强队队员阅读(7439) 评论(0) 推荐(0)

R语言集合函数

摘要：unionintersectsetdiff(A,B)：A-BA %in% B ：A是否存在于B 阅读全文

posted @ 2015-11-29 18:25 地表最强队队员阅读(634) 评论(0) 推荐(0)

R语言实战读书笔记(八)回归

摘要：简单线性：用一个量化验的解释变量预测一个量化的响应变量多项式：用一个量化的解决变量预测一个量化的响应变量，模型的关系是n阶多项式多元线性：用两个或多个量化的解释变量预测一个量化的响应变量多变量：用一个或多个解释变量预测多个响应变量Logistic：用一个或多个解释变量预测一个类别型响应变量泊松：用一... 阅读全文

posted @ 2015-11-29 16:32 地表最强队队员阅读(7392) 评论(0) 推荐(1)

R语言实战读书笔记(七)基本统计分析

摘要：summary()sapply(x,fun,options):对数据框或矩阵中的每一个向量进行统计meansd：标准差var：方差min:max:median:length:range:quantile:vars <- c("mpg", "hp", "wt")head(mtcars[vars])su... 阅读全文

posted @ 2015-11-27 20:49 地表最强队队员阅读(1814) 评论(0) 推荐(0)

R语言实战读书笔记(六)基本图形

摘要：#安装vcd包，数据集在vcd包中library(vcd)counts <- table(Arthritis$Improved)counts# 垂直barplot(counts, main = "Simple Bar Plot", xlab = "Improvement", ylab = "... 阅读全文

posted @ 2015-11-27 13:53 地表最强队队员阅读(989) 评论(0) 推荐(0)

R语言实战读书笔记(五)高级数据管理

摘要：5.2.1 数据函数abs:sqrt:ceiling:求不小于x的最小整数floor:求不大于x的最大整数trunc:向0的方向截取x中的整数部分round:将x舍入为指定位的小数signif:舍入为指定的有效数字位数cos,sin,tanacos,asin,atan:反正弦,反余弦,反正切cosh... 阅读全文

posted @ 2015-11-19 21:13 地表最强队队员阅读(467) 评论(0) 推荐(0)

R语言缺失值信息处理

摘要：mean(!is.na(mat))可以计算数据完整度(没有缺失值的)mean(!is.na(mat))>0.9,90%完整可以使用# 缺失值的位置研究as.vector(attributes(na.omit(mat))$na.action)which(rowSums(is.na(mat))!=0)w... 阅读全文

posted @ 2015-11-18 09:18 地表最强队队员阅读(620) 评论(0) 推荐(0)

R语言,NA,NAN

摘要：好莫名其妙的结果is.na() #NA得不到的值is.nan() #NAN不可能的值is.infinite() #无穷的x1<-NAx2<-0/0x3<-1/0is.na(x1) #TRUEis.nan(x1) #FALSEis.infinite(x1) #FALSEis.na(x2) #TRUEi... 阅读全文

posted @ 2015-11-17 19:44 地表最强队队员阅读(1203) 评论(0) 推荐(0)

R语言实战读书笔记(四)基本数据管理

摘要：4.2 创建新变量几个运算符:^或**：求幂x%%y：求余x%/%y：整数除4.3 变量的重编码with()：within()：可以修改数据框4.4 变量重命名包reshape中有个函数rename，可以改名 rename(df,c(manage='managerID',date='testDate... 阅读全文

posted @ 2015-11-15 19:28 地表最强队队员阅读(514) 评论(0) 推荐(0)

R语言实战读书笔记(三)图形初阶

摘要：这篇简直是白写了，写到后面发现ggplot明显更好用3.1 使用图形attach(mtcars)plot(wt, mpg) #x轴wt,y轴pgabline(lm(mpg ~ wt)) #画线拟合title("Regression of MPG on Weight")detach(mtcars)... 阅读全文

posted @ 2015-11-15 10:51 地表最强队队员阅读(617) 评论(0) 推荐(0)

R语言实战读书笔记(二)创建数据集

摘要：2.2.2 矩阵matrix(vector,nrow,ncol,byrow,dimnames,char_vector_rownames,char_vector_colnames)其中：byrow=TRUE/FALSE，表示按行填充还是按列填充，默认情况下是按列填充2.2.4 数据框1.attach,... 阅读全文

posted @ 2015-11-15 10:35 地表最强队队员阅读(526) 评论(0) 推荐(0)

R语言实战读书笔记(一)R语言介绍

摘要：1.3.3 工作空间getwd():显示当前工作目录setwd():设置当前工作目录ls():列出当前工作空间中的对象rm():删除对象1.3.4 输入与输出source():执行脚本阅读全文

posted @ 2015-11-15 10:10 地表最强队队员阅读(434) 评论(0) 推荐(0)

Machine Learning for hackers读书笔记_一句很重要的话

摘要：为了培养一个机器学习领域专家那样的直觉,最好的办法就是,对你遇到的每一个机器学习问题,把所有的算法试个遍,直到有一天,你凭直觉就知道某些算法行不通. 阅读全文

posted @ 2015-11-14 19:15 地表最强队队员阅读(182) 评论(0) 推荐(0)

Machine Learning for hackers读书笔记(十二)模型比较

摘要：library('ggplot2')df 0, 1, 0)mean(with(df, logit.predictions == Label))#正确率 0.5156,跟猜差不多一样的结果library('e1071')svm.fit0,1,0)mean(with(df,svm.prediction... 阅读全文

posted @ 2015-11-14 19:11 地表最强队队员阅读(404) 评论(0) 推荐(0)

Machine Learning for hackers读书笔记(十)KNN：推荐系统

摘要：#一，自己写KNNdf 0.5, 1, 0) } return(predictions)}#添加预测列df 0)sum(predictions != test.y)#结果是50行预测错了16个点,正确率只有68%,因此结论是如果问题完全不是线性时,K近邻的表现好过GLM#三、以下进行推荐案... 阅读全文

posted @ 2015-11-14 14:50 地表最强队队员阅读(387) 评论(0) 推荐(0)

R语言iris数据集的层次聚类

摘要：data=iris[,-5]dist.e=dist(data,method='euclidean')model1=hclust(dist.e,method='ward')#分3类result=cutree(model1,k=3)mds=cmdscale(dist.e,k=2,eig=T)x = md... 阅读全文

posted @ 2015-11-13 20:53 地表最强队队员阅读(2250) 评论(0) 推荐(0)

Machine Learning for hackers读书笔记(九)MDS：可视化地研究参议员相似性

摘要：library('foreign')library('ggplot2')data.dir6的是无效,1~3是赞成,4~6是反对票no.pres[,i]6,0,no.pres[,i])no.pres[,i]0&no.pres[,i]1,-1,no.pres[,i])}return(as.matrix(... 阅读全文

posted @ 2015-11-08 19:55 地表最强队队员阅读(416) 评论(0) 推荐(0)

Machine Learning for hackers读书笔记(八)PCA：构建股票市场指数

摘要：library('ggplot2')pricesymd('2001-12-31'))dji.prices<-subset(dji.prices,Date!=ymd('2002-02-01'))#道琼斯数据集中数据好多,只拿收盘价和日期来看一下dji<-with(dji.prices,rev(Clos... 阅读全文

posted @ 2015-11-08 19:04 地表最强队队员阅读(1146) 评论(0) 推荐(0)

Machine Learning for hackers读书笔记(七)优化：密码破译

摘要：#凯撒密码：将每一个字母替换为字母表中下一位字母，比如a变成b。english.letterslp1){return(proposed.cipher)}else{#如果旧的比较好,a<-exp(lp2-lp1)#x是均匀分布的0~1间随机数x<-runif(1) if(x<a){return(pro... 阅读全文

posted @ 2015-11-08 16:52 地表最强队队员阅读(336) 评论(1) 推荐(0)

R语言处理大规模数据集的编程要点

摘要：1.提高程序效率，保证执行速度(1)尽量使用向量化运算(2)尽量使用矩阵，必要时才使用数据框(3)使用read.table时，尽量显式设定colClasses和nrows，设定comment.char=""，把不需要的列设置为NULL(4)将外部数据导入矩阵时，使用scan函数(5)删除临时对象和不... 阅读全文

posted @ 2015-11-04 14:17 地表最强队队员阅读(2388) 评论(0) 推荐(0)

栽种绝处的花

随笔分类 - R语言

公告