随笔分类 -  数据科学

摘要:数据准备 step 1:加载数据 d <- read.table(filename,header=F,sep='\t')//header:要不要表头 step 2:数据划分:两类划分——训练集合测试集,通过重复划分进行验证/交叉验证估计过拟合(度量标准:AUC) set.seed(65536) #设 阅读全文
posted @ 2022-05-08 15:24 梅落南山 阅读(403) 评论(0) 推荐(0)
摘要:模型选择 机器学习:使用训练数据训练模型,利用模型进行预测,提升效果的算法。 有监督学习 分类 是有监督学习,通过学习一个已分类对象的数据集,基于产品属性或描述,建立一个分类器。 分类器的训练: step 1:使用训练集训练模型——学习过程 step 2:使用测试集验证过模型,评价模型效果——模型评 阅读全文
posted @ 2022-05-08 11:25 梅落南山 阅读(263) 评论(0) 推荐(0)
摘要:知识点来源课程PPT 数据准备 加载数据 step 1:导入数据,使用 read.table() 方法。 d<-read.table(paste('http://archive.ics.uci.edu/ml/machine-learning-databases/statlog/german/germ 阅读全文
posted @ 2022-05-06 22:17 梅落南山 阅读(114) 评论(0) 推荐(0)