随笔分类 -  R语言

怀念诶。 R是我接触过最像英语的语言
摘要:data_1_a=data_1[which(substr(data_1$id,16,16)==3),] #将data_1的id列第16个字符为3的数据抽取出来 作为新数据集data_1_a 阅读全文
posted @ 2020-07-22 14:03 Shilo 阅读(1800) 评论(0) 推荐(0)
摘要:#从data0数据中筛选出属于2018年的变量 library(sqldf)data_2018<- sqldf("select* from data0 where year='2018年'") #从data0数据中筛选出属于2018年的变量 data_2018=subset(data0,year== 阅读全文
posted @ 2019-12-17 16:37 Shilo 阅读(2941) 评论(0) 推荐(0)
摘要:#将data0数据按照ID计算样本量 library(dplyr)data_group<- group_by(data0, ID)data_GroupByID<- summarise(data_group,count = n())data_GroupByID<- data_GroupByID[ord 阅读全文
posted @ 2019-12-17 16:35 Shilo 阅读(5537) 评论(0) 推荐(0)
摘要:#创建空的数据框 data <- data.frame(ID= character(), age= numeric(), stringsAsFactors=FALSE) #排序 data2 <- data[order(data[,18],decreasing=F),] #将data数据集按照第18列 阅读全文
posted @ 2019-07-09 09:09 Shilo 阅读(345) 评论(0) 推荐(0)
摘要:data <- data.frame(ID= character(), age= numeric(), stringsAsFactors=FALSE) 阅读全文
posted @ 2019-07-08 10:37 Shilo 阅读(8821) 评论(0) 推荐(0)
摘要:data <- data[complete.cases(data[,5:6]),]#删除第五六列有空值的行 data <- na.omit(data)#删除有空值的行 阅读全文
posted @ 2019-06-20 10:45 Shilo 阅读(5791) 评论(0) 推荐(0)
摘要:一、merge data_merge <- (merge(data_name, data_inform, by = 'id')) 二、plyr的join library(plyr) data_join <- join(data_name, data_inform, by = "id") 三、sqld 阅读全文
posted @ 2019-06-18 11:16 Shilo 阅读(3067) 评论(0) 推荐(0)
摘要:a[is.na(a[,16]),16] <- 0 #16列为空的行,将16列填充为0 阅读全文
posted @ 2019-04-24 17:37 Shilo 阅读(2262) 评论(0) 推荐(0)
摘要:test[!duplicated(test),] 阅读全文
posted @ 2019-04-23 11:38 Shilo 阅读(121) 评论(0) 推荐(0)
摘要:重命名全部的列是 name(data) <- c("NO","name") 但是数据集有点长的时候用name,没办法对单个列 查了一下 colnames(data)[2] <- 'newname' 可行 阅读全文
posted @ 2019-03-20 11:08 Shilo 阅读(9555) 评论(0) 推荐(1)
摘要:整理一下目前在工作和学习中用到的分类模型效果,也就是俗称的“准确率”的各种表达形式。避免以后忘记,查一下又要给某论坛交记忆税。 (一)准确率accuracy 准确率=分类正确的样本数目/总样本量 大众通常意义上的准确率,一般客户会默认我们所说的准确率是这个定义。 在实际工作中该指标基本没有实际意义( 阅读全文
posted @ 2019-03-11 17:13 Shilo 阅读(1906) 评论(0) 推荐(0)