08 2015 档案
摘要:在导入数据并且将数据进行组织和初步可视化以后,需要对数据进行分布探索和两两关系分析等。主要内容有描述性统计分析、频数表和列联表、相关系数和协方差、t检验、非参数统计。7.1描述性统计分析7.1.1方法云集书上说,R中的描述性统计量函数“多的尴尬”。summary函数返回最大值、最小值、上下四分位数、...
阅读全文
摘要:首先写第二部分的前言。第二部分用来介绍获取数据基本信息的图形技术和统计方法。本章主要内容条形图、箱型图、点图饼图和扇形图直方图和核密度图分析数据第一步就是要观察它,用可视化的方式是最好的。本章的主题有两个1、将变量的分布作可视化展示2、通过结果变量进行跨组比较下面从不同的图形开始探索数据。6.1条形...
阅读全文
摘要:本章内容:数学和统计函数字符处理函数循环和条件执行自编函数数据整合与重塑5.1一个数据处理难题5.2数值和字符处理函数分为数值函数和字符串函数,下面是数学函数截图:ceiling、floor、trunc、signif函数第一次听说,是一些数位函数的处理函数。注意log是以e为底的。当上面的函数用在向...
阅读全文
摘要:本章内容:操纵日期和缺失值熟悉数据类型的转换变量的创建和重编码数据集的排序,合并与取子集选入和丢弃变量多说一句,数据预处理的时间是最长的……确实是这样的,额。4.1一个示例4.2创建新变量算术运算符:+、-、*、/、^(**)(求幂)、x %% y(取余运算)、x %/% y(整数除法)。trans...
阅读全文
摘要:3.4添加文本、自定义坐标轴和图例很多作图函数可以设置坐标轴和文本标注。比如标题、副标题、坐标轴标签、坐标轴范围等。需要注意的是并不是所有的绘图函数都有上述的参数,需要进行验证。可以将一些默认的参数进行移除,用ann = FALSE来操作。3.4.1标题title函数。title(main = NU...
阅读全文
摘要:3.1使用图形可以使用pdf等函数将图形直接保存在文件中。在运用attach和detach函数的使用中经常出现错误,比如命名重复的问题,所以,应该尽量避免使用这两个函数。plot是一般的画图函数,hist是直方图,boxplot是箱型图。这些函数会覆盖前面的图形,如何创建多个图形便于同时查看呢?方法...
阅读全文
摘要:2.1数据集的概念变量的类型是不同的,比如标示符、日期变量、连续变量、名义变量、有序型变量等,记得数据挖掘导论中有专门的描述。R可以处理的数据类型包括了数值型、字符型、逻辑型、复数型(虚数)、原生型(字节)。2.2数据结构R拥有很多存储数据的对象类型,包括 标量、向量、矩阵、数组、数据框、列表。它们...
阅读全文

浙公网安备 33010602011771号