随笔分类 -  R学习

上一页 1 2
R语言—统计结果输出至本地文件方法总结
摘要:1.sink()在代码开始前加一行:sink(“output.txt”),就会自动把结果全部输出到工作文件夹下的output.txt文本文档。这时在R控制台的输出窗口中是看不到输出结果的。代码结束时用sink()切换回来。 注:此处输出为mean(x)。 2.stargazer() 3.xlsRea 阅读全文
posted @ 2018-10-27 20:14 蔡军帅 阅读(5656) 评论(0) 推荐(0)
R语言学习——根据信息熵建决策树KD3
摘要:R语言代码 决策树的构建 输出结果会在当前工作台下的tree1.txt文件中 如图所示: 对输出结果的解释: 第一个挑出的是“children”这个属性,然后根据这个属性的1 3 0 2下设四个分支,其中1这个分支挑出的属性是“income”,下设3 2 5 4 1折5个分支,其中3这个分支停止了, 阅读全文
posted @ 2018-10-27 17:04 蔡军帅 阅读(1861) 评论(0) 推荐(0)
R语言 实验三 数据探索和预处理
摘要:计算缺失值个数 计算缺失率 简单统计量:计算最值 箱形图分析 分布分析:画出频率直方图 统计量分析:对于连续属性值,求出均值以及标准差 缺失值处理:删除法 去除无用属性:删除“ID”属性 或者 离散化:把“Children”属性转换成分类型的两个值“YES”和“NO”;把income属性按照节点12 阅读全文
posted @ 2018-10-25 00:13 蔡军帅 阅读(989) 评论(0) 推荐(0)
R语言画曲线图
摘要:本文以1950年到2010年期间我国的火灾统计数据为例,数据如下所示: (0)加载数据 data<-read.csv("E:\\MyDocument\\p\\Data\\1950~2010火灾情况.csv") x=t(data[1]) y=t(data[2]) z=t(data[3]) w=t(da 阅读全文
posted @ 2018-10-11 11:07 蔡军帅 阅读(1454) 评论(0) 推荐(0)
R语言学习——数据分析
摘要:complete.cases查看缺失值 箱图: 阅读全文
posted @ 2018-10-11 10:42 蔡军帅 阅读(283) 评论(0) 推荐(0)
R语言学习——输入与输出
摘要:导入数据: grades<-read.table("D:/ProgramData/test1.txt",sep="\t") 求均值:mean() 求方差:sd() 保存数据:write.table(grades,"D:/ProgramData/test2.txt") 阅读全文
posted @ 2018-09-30 15:15 蔡军帅 阅读(728) 评论(0) 推荐(1)
R语言学习——R读取txt、csv、xls和xlsx格式文件
摘要:最近项目中运用到了R读取文件数据,所以把相关好用的、经过验证的方法总结了一下,有效避免下次入坑。 1. R读取txt文件 使用R读取txt文件直接使用read.table()方法进行读取即可,不需要加载额外的包。 1 注意,此处的na.strings = c("NA") 的意思是文件中的缺失数据都是 阅读全文
posted @ 2018-09-30 14:49 蔡军帅 阅读(139782) 评论(0) 推荐(3)
R语言学习——因子
摘要:1、因子 因子的设计思想来源于统计学的名义变量,或称为分类变量。 分类变量的值本质上不是数字,而是对应为分类/分组。 因子分为无序因子和有序因子。 因子的类别称为level,结合level,因子在内部被编码为指向level的正整数序号。 函数str():Compactly Display the S 阅读全文
posted @ 2018-09-30 14:17 蔡军帅 阅读(1125) 评论(0) 推荐(0)
R语言学习——列表
摘要:1、列表 列表是一种泛化的向量,其并没有要求所有元素都是同一类型,其元素甚至可为任意类型。 列表格式自由,为统计的计算结果的返回提供了极便利的方法。 2、列表的创建 可以用list()函数创建列表。 模板:mylist<-list(name1=object1,…) 其中name可以省略 3、元素的引 阅读全文
posted @ 2018-09-30 14:06 蔡军帅 阅读(925) 评论(0) 推荐(0)
R语言学习——数组
摘要:1、数组:数组是超过2维的相同元素的集合。 矩阵就是二维的数组。 2、数组的创建 array函数来创建数组。 3、元素的引用: 下标索引。 名字索引。 同维度逻辑对象筛选。 阅读全文
posted @ 2018-09-29 19:54 蔡军帅 阅读(393) 评论(0) 推荐(0)
R语言学习——条件筛选
摘要: 阅读全文
posted @ 2018-09-29 19:05 蔡军帅 阅读(1147) 评论(0) 推荐(0)
R语言学习——向量,矩阵
摘要:在R中,基本的数据结构有:向量,矩阵,数组,数据框,列表,因子,函数等。 向量:一系列同类型的有序元素构成。 向量是一维结构。 向量是R最简单的数据结构,在R中没有标量。 标量被看成1个元素的向量。 向量元素必须是同类型的。 由于向量是最简单的数据结构,因此本章中以向量为例子来解释各个概念。 矩阵: 阅读全文
posted @ 2018-09-29 18:55 蔡军帅 阅读(1824) 评论(0) 推荐(0)
R语言学习——欧拉计划(11)Largest product in a grid
摘要:Problem 11 Problem 11 In the 20×20 grid below, four numbers along a diagonal line have been marked in red. 08 02 22 97 38 15 00 40 00 75 04 05 07 78 5 阅读全文
posted @ 2018-09-29 00:51 蔡军帅 阅读(499) 评论(0) 推荐(0)
R语言学习——欧拉计划(3)Largest prime factor 求最大质因数
摘要:The prime factors of 13195 are 5, 7, 13 and 29. What is the largest prime factor of the number 600851475143 ? 翻译过后如下: 找出一个合数的最大质数因子 13195的质数因子有5,7,13和 阅读全文
posted @ 2018-09-28 19:50 蔡军帅 阅读(436) 评论(0) 推荐(0)
R语言学习——欧拉计划(1)Multiples of 3 and 5
摘要:【题目一】If we list all the natural numbers below 10 that are multiples of 3 or 5, we get 3, 5, 6 and 9. The sum of these multiples is 23.Find the sum of 阅读全文
posted @ 2018-09-27 14:13 蔡军帅 阅读(813) 评论(1) 推荐(1)
R语言学习——循环判断语句
摘要:循环 判断 函数 函数是一个对象,可以赋值 函数要放在调用函数的前面 输入输出 read.csv() 文本文件 csv是comma separated value的英文缩写,其读取逗号分隔的文本文件。 read.csv()与read.table()的区别可以看他们的默认参数值。 read.table 阅读全文
posted @ 2018-09-27 11:47 蔡军帅 阅读(3194) 评论(0) 推荐(0)
R语言学习——数据框
摘要:创建数据框 attributes用于看属性 数据框有矩阵特性:可用rownsmes(),colnames()对行列命名 因子,level可以修改因子,新增数据时必须先修改类别再修改数据。 阅读全文
posted @ 2018-09-27 10:53 蔡军帅 阅读(355) 评论(0) 推荐(0)

上一页 1 2