随笔分类 -  R

摘要:本章介绍时间序列中的基本概念。特别地,介绍随机过程、均值、方差、协方差函数、平稳过程和自相关函数等概念。 2.1时间序列与随机过程 关于随机过程的定义,本科上过相关课程,用的是《应用随机过程》清华林元烈老师的书。第1章第5节: 上面的定义比较清楚明白。按照本书上的说法,随机变量序列就是一个随机过程, 阅读全文
posted @ 2016-02-05 13:33 司空格子Ored 阅读(2241) 评论(0) 推荐(0)
摘要:从张丹的日志(http://blog.fens.me/rhadoop-r-basic/)中第九条对象看到R对象的几个总结:1、内在属性mode length 所有对象都有的属性2、外部属性attributes() 函数可以查看外部属性;attr(x,“a”) a b f outer(a,b,f... 阅读全文
posted @ 2015-09-23 10:10 司空格子Ored 阅读(749) 评论(0) 推荐(0)
摘要:在导入数据并且将数据进行组织和初步可视化以后,需要对数据进行分布探索和两两关系分析等。主要内容有描述性统计分析、频数表和列联表、相关系数和协方差、t检验、非参数统计。7.1描述性统计分析7.1.1方法云集书上说,R中的描述性统计量函数“多的尴尬”。summary函数返回最大值、最小值、上下四分位数、... 阅读全文
posted @ 2015-08-22 17:08 司空格子Ored 阅读(2372) 评论(0) 推荐(0)
摘要:首先写第二部分的前言。第二部分用来介绍获取数据基本信息的图形技术和统计方法。本章主要内容条形图、箱型图、点图饼图和扇形图直方图和核密度图分析数据第一步就是要观察它,用可视化的方式是最好的。本章的主题有两个1、将变量的分布作可视化展示2、通过结果变量进行跨组比较下面从不同的图形开始探索数据。6.1条形... 阅读全文
posted @ 2015-08-16 00:50 司空格子Ored 阅读(2193) 评论(0) 推荐(0)
摘要:本章内容:数学和统计函数字符处理函数循环和条件执行自编函数数据整合与重塑5.1一个数据处理难题5.2数值和字符处理函数分为数值函数和字符串函数,下面是数学函数截图:ceiling、floor、trunc、signif函数第一次听说,是一些数位函数的处理函数。注意log是以e为底的。当上面的函数用在向... 阅读全文
posted @ 2015-08-14 16:01 司空格子Ored 阅读(1820) 评论(0) 推荐(0)
摘要:本章内容:操纵日期和缺失值熟悉数据类型的转换变量的创建和重编码数据集的排序,合并与取子集选入和丢弃变量多说一句,数据预处理的时间是最长的……确实是这样的,额。4.1一个示例4.2创建新变量算术运算符:+、-、*、/、^(**)(求幂)、x %% y(取余运算)、x %/% y(整数除法)。trans... 阅读全文
posted @ 2015-08-11 00:28 司空格子Ored 阅读(980) 评论(0) 推荐(0)
摘要:3.4添加文本、自定义坐标轴和图例很多作图函数可以设置坐标轴和文本标注。比如标题、副标题、坐标轴标签、坐标轴范围等。需要注意的是并不是所有的绘图函数都有上述的参数,需要进行验证。可以将一些默认的参数进行移除,用ann = FALSE来操作。3.4.1标题title函数。title(main = NU... 阅读全文
posted @ 2015-08-09 19:22 司空格子Ored 阅读(1050) 评论(0) 推荐(0)
摘要:3.1使用图形可以使用pdf等函数将图形直接保存在文件中。在运用attach和detach函数的使用中经常出现错误,比如命名重复的问题,所以,应该尽量避免使用这两个函数。plot是一般的画图函数,hist是直方图,boxplot是箱型图。这些函数会覆盖前面的图形,如何创建多个图形便于同时查看呢?方法... 阅读全文
posted @ 2015-08-09 16:37 司空格子Ored 阅读(998) 评论(0) 推荐(0)
摘要:2.1数据集的概念变量的类型是不同的,比如标示符、日期变量、连续变量、名义变量、有序型变量等,记得数据挖掘导论中有专门的描述。R可以处理的数据类型包括了数值型、字符型、逻辑型、复数型(虚数)、原生型(字节)。2.2数据结构R拥有很多存储数据的对象类型,包括 标量、向量、矩阵、数组、数据框、列表。它们... 阅读全文
posted @ 2015-08-04 16:58 司空格子Ored 阅读(5155) 评论(0) 推荐(0)
摘要:1、典型的数据分析过程可以总结为一下图形:注意,在模型建立和验证的过程中,可能需要重新进行数据清理和模型建立。2、R语言一般用 也可以。3、age <- c(1,3,5,2,11,9,3,9,12,3)weight <- c(4.4,5.3,7.2,5.2,8.5,7.3,6.0,10.4,10.2... 阅读全文
posted @ 2015-07-31 20:45 司空格子Ored 阅读(2000) 评论(1) 推荐(0)
摘要:本人最近在某咨询公司实习,涉及到了一些数据分析的工作,用的是R语言来处理数据。但是在应用的过程中,发现用R很不熟练,所以再打算学一遍R。曾经花一个月的时间看过一遍《R语言编程艺术》,还用R做过阿里的推荐算法比赛,对R语言有一些最初级、基本的了解。不过 ,上面那本书虽然挺好,但是不适合速成,是从程序员... 阅读全文
posted @ 2015-07-31 18:39 司空格子Ored 阅读(527) 评论(0) 推荐(0)