博客园  :: 首页  :: 联系 :: 管理
上一页 1 ··· 21 22 23 24 25 26 27 28 29 ··· 35 下一页

2017年4月27日

摘要: write.table() 数据导入导出最常用的方式是使用read.table()函数和write.table()处理CSV文件的导入导出,read.table()和write.table()可以处理包含行、列标签的数据框 Usage: write.table(x, file = "", appen 阅读全文

posted @ 2017-04-27 08:46 天戈朱 阅读(512) 评论(0) 推荐(0) 编辑

2017年4月24日

摘要: sample: 从整体中挑出部分样本数据函数 Usage: sample.int(n, size = n, replace = FALSE, prob = NULL) x:可以是R中任何​对象 size: 指定在向量中抽取元素的个数 replace:默认是F,表示每次​抽取后的数就不能在下一次被抽取 阅读全文

posted @ 2017-04-24 08:53 天戈朱 阅读(416) 评论(0) 推荐(0) 编辑

2017年4月19日

摘要: ML3.1 介绍e1071包实施朴素贝叶斯分类的函数,本例使用klaR包中的NaiveBayes函数,因为该函数较之前者增加了两个功能,一个是可以输入先验概率,另一个是在正态分布基础上增加了核平滑密度函数。为了避免过度拟合,在训练时还要将数据分割进行多重检验,所以我们还使用了caret包的一些函数进 阅读全文

posted @ 2017-04-19 08:53 天戈朱 阅读(431) 评论(0) 推荐(0) 编辑

2017年4月18日

摘要: 读取csv文件出现中文乱码方案,增加编码格式参数 read.csv(trainPath,header=TRUE,stringsAsFactors=TRUE,encoding = "UTF-8") 保存csv文件中出现乱码,编码格式参数 write.csv(outp, file = path, quo 阅读全文

posted @ 2017-04-18 07:52 天戈朱 阅读(11607) 评论(1) 推荐(1) 编辑

2017年4月17日

摘要: 决策树模型中最为流行的是C4.5算法, 该类算法70年代末,J Ross Quinlan提出ID3算法,此算法的目的在于减少树的深度。但是忽略了叶子数目的研究。1993年,Quinlan本人以ID3算法为基础研究出C4.5/C5.0算法,C4.5算法在ID3算法的基础上进行了改进,对于预测变量的缺值 阅读全文

posted @ 2017-04-17 21:26 天戈朱 阅读(508) 评论(0) 推荐(0) 编辑

摘要: 随机森林模型是一种数据挖掘模型,常用于进行分类预测。随机森林模型包含多个树形分类器,预测结果由多个分类器投票得出。 决策树相当于一个大师,通过自己在数据集中学到的知识对于新的数据进行分类。俗话说得好,一个诸葛亮,玩不过三个臭皮匠。随机森林就是希望构建多个臭皮匠,希望最终的分类效果能够超过单个大师的一 阅读全文

posted @ 2017-04-17 00:40 天戈朱 阅读(8393) 评论(0) 推荐(0) 编辑

摘要: K近邻算法,即K-Nearest Neighbor algorithm,简称KNN算法,可以简单的理解为由那离自己最近的K个点来投票决定待分类数据归为哪一类。这个算法是机器学习里面一个比较经典的算法, 总体来说KNN算法是相对比较容易理解的算法。其中的K表示最接近自己的K个数据样本。KNN算法和K- 阅读全文

posted @ 2017-04-17 00:40 天戈朱 阅读(1004) 评论(0) 推荐(0) 编辑

摘要: 决策树(Decision Tree)是用于分类和预测的主要技术,它着眼于从一组无规则的事例推理出决策树表示形式的分类规则,采用自顶向下的递归方式,在决策树的内部节点进行属性值的比较,并根据不同属性判断从该节点向下分支,在决策树的叶节点得到结论。因此,从根节点到叶节点就对应着一条合理规则,整棵树就对应 阅读全文

posted @ 2017-04-17 00:39 天戈朱 阅读(959) 评论(0) 推荐(0) 编辑

摘要: CART模型 :即Classification And Regression Trees。它和一般回归分析类似,是用来对变量进行解释和预测的工具,也是数据挖掘中的一种常用算法。如果因变量是连续数据,相对应的分析称为回归树,如果因变量是分类数据,则相应的分析称为分类树。决策树是一种倒立的树结构,它由内 阅读全文

posted @ 2017-04-17 00:39 天戈朱 阅读(838) 评论(0) 推荐(0) 编辑

2017年4月10日

摘要: 朴素贝叶斯方法是一种使用先验概率去计算后验概率的方法, 具体见ML(3): 贝叶斯方法 R包 ① e1071::e1071 ② klaR::klaR 参考资料:https://en.wikibooks.org/wiki/Data_Mining_Algorithms_In_R/Classificati 阅读全文

posted @ 2017-04-10 22:17 天戈朱 阅读(1111) 评论(0) 推荐(0) 编辑

上一页 1 ··· 21 22 23 24 25 26 27 28 29 ··· 35 下一页