摘要: 0 引言 对于一些数据集,不可避免的出现缺失值。对缺失值的处理非常重要,它是我们能否继续进行数据分析的关键,也是能否继续大数据分析的数据基础。 1 缺失值分类 在对缺失数据进行处理前,了解数据缺失的机制和形式是十分必要的。将数据集中不含缺失值的变量称为完全变量,数据集中含有缺失值的变量称为不完全变量 阅读全文
posted @ 2018-05-13 20:46 一菲宝宝 阅读(2721) 评论(0) 推荐(0)
摘要: 转http://www.cnblogs.com/jiangmiaomiao/p/6991632.html 0 引言 R支持4种图形类型: base graphics, grid graphics, lattice graphics, ggplot2。其中,Base graphics是R的默认图形系统 阅读全文
posted @ 2018-05-13 11:28 一菲宝宝 阅读(931) 评论(0) 推荐(0)
摘要: 0 引言 随机森林算法以其众多优点而广泛应用于数据挖掘及分类回归中,具体优点请自学哈哈。我是从做分类入手,是个菜鸟。 1 算法原理 2 建模 3 仿真结果 4 结果分析及总结 程序附录 Examples ## Classification:##data(iris)set.seed(71)iris.r 阅读全文
posted @ 2018-05-13 10:17 一菲宝宝 阅读(588) 评论(0) 推荐(0)
摘要: 0 引言 在学习R语言的过程中,会遇到很多常用命令及自己研究领域需要记住的功能命令,下面是我自己在学习过程中遇到的,对其做了一个小总结,方便以后使用。 1 常用命令 1.1 多行注释 简单的,R中的多行注释首先可以使用快捷键来实现。由于R中无类似C与C++中的/**/多行注释符,但可以利用一些语句同 阅读全文
posted @ 2018-05-13 10:02 一菲宝宝 阅读(6074) 评论(0) 推荐(0)
摘要: 0 引言 使用R语言、Python等进行数据处理的第一步就是要导入数据(也可以使用UCI数据集),下文主要根据R语言的帮助文档来介绍外部文件数据的导入方法和注意事项。下面先附上一些指令。 1 格式read.table read.table(file, header = FALSE, sep ="", 阅读全文
posted @ 2018-05-12 13:38 一菲宝宝 阅读(9792) 评论(0) 推荐(1)
摘要: 通常用以下三个指标来衡量模型误差: 阅读全文
posted @ 2018-05-09 13:13 一菲宝宝 阅读(295) 评论(0) 推荐(0)
摘要: 一:测量字段 • 默认值。具有未知存储类型和值的数据(例如,由于其尚未被读取)将显示为<默认值>。 • 连续。用于描述整数、实数或日期/时间等数字值,如范围 0 - 100 或 0.75 - 1.25。 • 分类。用于字符串值(可取的值的确切数量未知时)。这是一种非实例化数据类型,表示有关数据存储类 阅读全文
posted @ 2018-04-11 13:47 一菲宝宝 阅读(1936) 评论(0) 推荐(0)
摘要: https://www.cnblogs.com/sylvanas2012/p/4328861.html写得特别好,推荐阅读 Holt-Winters: 三阶指数平滑 Holt-Winters的思想是把数据分解成三个成分:平均水平(level),趋势(trend),周期性(seasonality)。R 阅读全文
posted @ 2018-04-08 11:51 一菲宝宝 阅读(255) 评论(0) 推荐(0)
摘要: FIFO、LRU、OPT这三种置换算法的缺页次数 转载 由于要考计算机四级网络,这里遇到了问题,就搜了一些资料来解疑。 转载 由于要考计算机四级网络,这里遇到了问题,就搜了一些资料来解疑。 考虑下述页面走向: 1,2,3,4,2,1,5,6,2,1,2,3,7,6,3,2,1,2,3,6 当内存块数 阅读全文
posted @ 2018-03-22 17:35 一菲宝宝 阅读(6914) 评论(0) 推荐(0)
摘要: There are primarily 3 features which can be tuned to improve the predictive power of the model : 说明:随机森林有3个比较重要的参数,对结果影响比较大,max_features,n_estimators, 阅读全文
posted @ 2018-03-05 21:12 一菲宝宝 阅读(200) 评论(0) 推荐(0)