随笔分类 - R语言
怀念诶。
R是我接触过最像英语的语言
摘要:data_1_a=data_1[which(substr(data_1$id,16,16)==3),] #将data_1的id列第16个字符为3的数据抽取出来 作为新数据集data_1_a
阅读全文
摘要:#从data0数据中筛选出属于2018年的变量 library(sqldf)data_2018<- sqldf("select* from data0 where year='2018年'") #从data0数据中筛选出属于2018年的变量 data_2018=subset(data0,year==
阅读全文
摘要:#将data0数据按照ID计算样本量 library(dplyr)data_group<- group_by(data0, ID)data_GroupByID<- summarise(data_group,count = n())data_GroupByID<- data_GroupByID[ord
阅读全文
摘要:#创建空的数据框 data <- data.frame(ID= character(), age= numeric(), stringsAsFactors=FALSE) #排序 data2 <- data[order(data[,18],decreasing=F),] #将data数据集按照第18列
阅读全文
摘要:data <- data.frame(ID= character(), age= numeric(), stringsAsFactors=FALSE)
阅读全文
摘要:data <- data[complete.cases(data[,5:6]),]#删除第五六列有空值的行 data <- na.omit(data)#删除有空值的行
阅读全文
摘要:一、merge data_merge <- (merge(data_name, data_inform, by = 'id')) 二、plyr的join library(plyr) data_join <- join(data_name, data_inform, by = "id") 三、sqld
阅读全文
摘要:a[is.na(a[,16]),16] <- 0 #16列为空的行,将16列填充为0
阅读全文
摘要:重命名全部的列是 name(data) <- c("NO","name") 但是数据集有点长的时候用name,没办法对单个列 查了一下 colnames(data)[2] <- 'newname' 可行
阅读全文
摘要:整理一下目前在工作和学习中用到的分类模型效果,也就是俗称的“准确率”的各种表达形式。避免以后忘记,查一下又要给某论坛交记忆税。 (一)准确率accuracy 准确率=分类正确的样本数目/总样本量 大众通常意义上的准确率,一般客户会默认我们所说的准确率是这个定义。 在实际工作中该指标基本没有实际意义(
阅读全文

浙公网安备 33010602011771号