随笔分类 - 数据科学
摘要:数据准备 step 1:加载数据 d <- read.table(filename,header=F,sep='\t')//header:要不要表头 step 2:数据划分:两类划分——训练集合测试集,通过重复划分进行验证/交叉验证估计过拟合(度量标准:AUC) set.seed(65536) #设
阅读全文
摘要:模型选择 机器学习:使用训练数据训练模型,利用模型进行预测,提升效果的算法。 有监督学习 分类 是有监督学习,通过学习一个已分类对象的数据集,基于产品属性或描述,建立一个分类器。 分类器的训练: step 1:使用训练集训练模型——学习过程 step 2:使用测试集验证过模型,评价模型效果——模型评
阅读全文
摘要:知识点来源课程PPT 数据准备 加载数据 step 1:导入数据,使用 read.table() 方法。 d<-read.table(paste('http://archive.ics.uci.edu/ml/machine-learning-databases/statlog/german/germ
阅读全文

浙公网安备 33010602011771号