摘要: 第1章 简介 1.3图形的语法 第2章从qplot开始入门 1、基本用法:qplot(x,y,data) x是自变量横轴,y是因变量纵轴,data是数据框 2、图形参数 colour=I("red"),shape,size=I(2),alpha=I(1/20) colour是(外框)颜色,fill是 阅读全文
posted @ 2016-05-27 20:59 萱草yy 阅读(3627) 评论(0) 推荐(0) 编辑
摘要: 平时在一些数据处理中,经常会把原始数据取对数后进一步处理。之所以这样做是基于对数函数在其定义域内是单调增函数,取对数后不会改变数据的相对关系,取对数作用主要有:1. 缩小数据的绝对数值,方便计算。例如,每个数据项的值都很大,许多这样的值进行计算可能对超过常用数据类型的取值范围,这时取对数,就把数值缩小了,例如TF-IDF计算时,由于在大规模语料库中,很多词的频率是非常大的数字。2. 取对数后,可以... 阅读全文
posted @ 2016-05-27 20:33 萱草yy 阅读(3491) 评论(0) 推荐(0) 编辑
摘要: 时间序列分析之ARIMA模型预测__R篇 之前一直用SAS做ARIMA模型预测,今天尝试用了一下R,发现灵活度更高,结果输出也更直观。现在记录一下如何用R分析ARIMA模型。 1. 处理数据 1.1. 导入forecast包 forecast包是一个封装的ARIMA统计软件包,在默认情况下,R没有预 阅读全文
posted @ 2016-05-27 20:23 萱草yy 阅读(37212) 评论(3) 推荐(2) 编辑
摘要: 本文转载自cador《使用R语言进行异常检测》本文结合R语言,展示了异常检测的案例,主要内容如下:(1)单变量的异常检测(2)使用LOF(local outlier factor,局部异常因子)进行异常检测(3)通过聚类进行异常检测(4)对时间序列进行异常检测一、单变量异常检测本部分展示了一个单变量异常检测的例子,并且演示了如何将这种方法应用在多元数据上。在该例中,单变量异常检测通过boxplot... 阅读全文
posted @ 2016-05-27 20:21 萱草yy 阅读(4862) 评论(0) 推荐(1) 编辑
摘要: R语言学习笔记:日期处理1、取出当前日期Sys.Date()[1] "2014-10-29"date() #注意:这种方法返回的是字符串类型[1] "Wed Oct 29 20:36:07 2014"2、在R中日期实际是double类型,是从1970年1月1日以来的天数typeof(Sys.Date())[1] "double"3、转换为日期用as.Date()可以将一个字符串转换为日期值,默认格... 阅读全文
posted @ 2016-05-27 20:19 萱草yy 阅读(1656) 评论(0) 推荐(0) 编辑