posted @ 2018-09-05 09:41
DianaLi
阅读(124)
推荐(0)
摘要:
最近一段时间累惨了,学校生活是各种论文代码PPT,家庭生活是各种老妈孩子和忙碌。 我深深感受到了生活赋予我的压力与苦累,是真的很累,不管是心理还是生理。。。 我开始慢慢觉醒,慢慢感受生活的温度,我的思想和灵魂每天都在燃烧,每天都在重复激励自己一定要努力, 生活已然成为一种温度的体验,但是我不能因此怯
阅读全文
posted @ 2018-06-10 12:00
DianaLi
阅读(151)
推荐(0)
摘要:
k折交叉验证(R语言) 原创: 三猫 机器学习养成记 2017-11-26 “ 机器学习中需要把数据分为训练集和测试集,因此如何划分训练集和测试集就成为影响模型效果的重要因素。本文介绍一种常用的划分最优训练集和测试集的方法——k折交叉验证。” k折交叉验证 K折交叉验证(k-fold cross-v
阅读全文
posted @ 2018-06-05 20:47
DianaLi
阅读(8641)
推荐(0)
摘要:
R语言之Random Forest随机森林 什么是随机森林? 随机森林就是通过集成学习的思想将多棵树集成的一种算法,它的基本单元是决策树,而它的本质属于机器学习的一大分支——集成学习(Ensemble Learning)方法。随机森林的名称中有两个关键词,一个是“随机”,一个就是“森林”。“森林”我
阅读全文
posted @ 2018-06-05 20:40
DianaLi
阅读(4426)
推荐(0)
摘要:
#####缺失值判断以及处理##### #举例1:向量类型判断缺失值is.na和缺失值的填补which (x<-c(1,2,3,NA)) is.na(x) #返回一个逻辑向量,TRUE为缺失值,FALSE为非缺失值 table(is.na(x)) #统计分类个数 sum(x) #当向量存在缺失值的时
阅读全文
posted @ 2018-06-05 20:36
DianaLi
阅读(892)
推荐(0)
摘要:
awesome-machine-learning. 这里是包的导航清单,看起来更方便 >>>导航清单 通过这些翻译了解这些工具包,以后干活也就方便多了。不过翻译这个东西的确要靠耐心,翻译,编辑花费了至少一周的空余时间。 在编辑本文的过程中,惊喜的发现Awesome系列的其他资源:地址在github:
阅读全文
posted @ 2018-05-31 20:00
DianaLi
阅读(1200)
推荐(0)
摘要:
一、异常值检验 异常值大概包括缺失值、离群值、重复值,数据不一致。 1、基本函数 summary可以显示每个变量的缺失值数量. 2、缺失值检验 关于缺失值的检测应该包括:缺失值数量、缺失值比例、缺失值与完整值数据筛选。 [plain] view plain copy #缺失值解决方案 sum(com
阅读全文
posted @ 2018-05-31 13:33
DianaLi
阅读(2317)
推荐(0)
posted @ 2018-05-30 11:46
DianaLi
阅读(2)
推荐(0)