文章分类 -  R

sparklyr使用相关
摘要:连接Spark 安装好sparklyr包之后,我们连接本地的Spark,也可以连接远程的Spark集群。这里,我们使用spark_connect函数来连接远程的Spark集群: dplyr导论提供了许多dplyr包中函数的使用案例。以下案例演示的是航班延误信息的数据可视化: 绘图 窗口函数 支持dp 阅读全文

posted @ 2018-04-19 15:43 银河统计 阅读(975) 评论(0) 推荐(0) 编辑

R通过RJDBC连接Hive相关
摘要:连接方式1 require("DBI") require("rJava") require("RJDBC") username 阅读全文

posted @ 2018-04-19 15:16 银河统计 阅读(783) 评论(0) 推荐(0) 编辑

R语言-shiny、knitr、printr、servr及tufte包
摘要:shiny R Shiny "R Shiny Shiny应用基础" knitr R Rmarkdown R shinydashboard R knitr "通过Rmarkdown包调用knitr和pandoc" "Rstudio+knitr 生成pdf文件的方法" "Knitr R代码 highli 阅读全文

posted @ 2017-07-26 14:47 银河统计 阅读(1525) 评论(0) 推荐(0) 编辑

R语言-默认镜像设置
摘要:问题1:如何设置默认镜像 你希望下载某些R包,因此希望设定默认的CRAN网站镜像,这样R每次下载时不需要你选择镜像。 解决方案 该方案要求用户R系统中包含一个 文件,如方法3.16描述的那样: 1.调用chooseCRANmirror函数: R会显示CRAN镜像的列表。 2.从列表中选择镜像并点击确 阅读全文

posted @ 2017-07-16 23:41 银河统计 阅读(11396) 评论(0) 推荐(0) 编辑

R语言-do.call用法小结
摘要:Examples1 r do.call("complex", list(imag = 1:3)) if we already have a list (e.g., a data frame) we need c() to add further arguments tmp 阅读全文

posted @ 2017-07-16 23:05 银河统计 阅读(3178) 评论(0) 推荐(0) 编辑

R语言-实用功能性语句3
摘要:目录概览   1) R取值有技巧,drop选项巧帮助   2) R中逻辑运算符(logical operator)   3) 递归   4) R图例空元素,0和NA来代替   5) 字符串转代码很容易,eval()/parse()很随意   阅读全文

posted @ 2017-07-16 17:09 银河统计 阅读(684) 评论(0) 推荐(0) 编辑

R语言-帮助文档dplyr和tidyr包用法说明
摘要:![](http://images.galaxystatistics.com/blog_image/help/dplyr_tidyr_1.png) ![](http://images.galaxystatistics.com/blog_image/help/dplyr_tidyr_2.png) 阅读全文

posted @ 2017-07-09 18:20 银河统计 阅读(827) 评论(0) 推荐(0) 编辑

R语言-赞你包_praise包
摘要:(2017 07 08 银河统计) 前言   praise包就一个功能:赞你! 目录  1. praise包安装  2. praise包开启赞你模式 1. praise包安装 直接安装: install.packages("praise") 从github上安 阅读全文

posted @ 2017-07-08 10:52 银河统计 阅读(937) 评论(0) 推荐(0) 编辑

R语言-启动项相关文件配置
摘要:(2017 07 08 银河统计) 前言 你是否希望通过改变配置选项或预加载R包,来客户化R进程,进而更加方便的使用R进行数据分析和挖掘。下文将详细介绍R启动项相关文件的配置,方便大家查找和使用。 目录  1. R语言的启动  2. R语言自定义启动环境 1. R语言的启动 下面 阅读全文

posted @ 2017-07-04 23:26 银河统计 阅读(10338) 评论(1) 推荐(1) 编辑

R语言-排序
摘要:前言   在R中,和排序相关的函数主要有三个:sort(),rank(),order()、arrange()。其中R中自带排序函数有 order,sort,rank 函数,plyr中有 arrange 函数。   order和sort是针对向量进行操作的,ar 阅读全文

posted @ 2017-06-25 16:18 银河统计 阅读(15852) 评论(0) 推荐(0) 编辑

R语言-日志logging包
摘要:(2017 06 25 银河统计) 前言   程序中日志文件(log文件)一般有两个目的:查询历史操作发现问题和显示程序运行状态。好的日志记录方式可以提供我们足够多定位问题的依据。日志记录大家都会认为简单,但如何通过日志可以高效定位问题并不是简单的事情。这里以R语言的loggin 阅读全文

posted @ 2017-06-25 14:13 银河统计 阅读(3556) 评论(0) 推荐(0) 编辑

R语言-数据类型、结构以及对象类型4
摘要:目录  1. 向量(vector)  2. 因子(factor)  3. 矩阵(matrix)  4. 列表(list)  5. 数据框(data frame)  6. 特殊值数据  7. 获取数据类型信息的一些有用函数 1. 向 阅读全文

posted @ 2017-06-11 22:08 银河统计 阅读(1496) 评论(0) 推荐(0) 编辑

R语言-实用功能性语句2
摘要:(2017 05 30 银河统计)   本篇文章对工作中使用的R语言实用语句进行总结,方便查找和复用。 目录概览   1) R语言生成表格html   2) Json格式数据和R格式数据互转   3) [ ]数据的提取   4) which 阅读全文

posted @ 2017-05-30 22:23 银河统计 阅读(1174) 评论(0) 推荐(0) 编辑

R语言-文件管理系统操作
摘要:前言   R语言作为脚本语言,有一套文件系统管理的功能函数,和其他编程语言一样,都能对文件系统进行操作,包括文件操作和目录操作,相关函数都定义在base包中。 目录 1.文件系统介绍 2.文件系统操作函数概览 3.目录操作 4.文件操作 5.几个特殊的目录 1. 文件系统介绍 & 阅读全文

posted @ 2017-01-18 20:41 银河统计 阅读(2996) 评论(0) 推荐(0) 编辑

R语言-数据可视化-ggplot2包
摘要:R ggplot2画图 参考 "ggplot2_系列1" "ggplot2_系列2" "ggolot2 画ROC曲线" "R语言中值得学习的7个可视化,附代码段&案例数据集" "如何通过Google来使用ggplot2可视化" "Better labels" "ggplot2 doc" "ggplo 阅读全文

posted @ 2016-12-31 22:05 银河统计 阅读(474) 评论(0) 推荐(0) 编辑

R语言-异常数据处理4
摘要:R语言中离群值的识别、描述、绘制与移除 前言   统计学中离群值被定义为离开大部分观测较远的样本点,多数是由于测量误差而产生。因此,数据分析中离群值的识别和移除(如有必要)是很重要的一个步骤。   鉴定离群值的方法有很多种,包括基于标准差的方法和基于四分位距的 阅读全文

posted @ 2016-09-13 14:09 银河统计 阅读(1532) 评论(0) 推荐(0) 编辑

R语言-统计分布和模拟
摘要:R语言中统计分布和模拟 前言   很多应用都需要随机数。像interlink connection,密码系统、视频游戏、人工智能、优化、问题的初始条件,金融等都需要生成随机数。但实际上目前我们并没有“真正”的随机数生成器,尽管有一些伪随机数生成器也是非常有效的。 目录 &emsp 阅读全文

posted @ 2016-07-16 15:41 银河统计 阅读(27119) 评论(0) 推荐(2) 编辑

R语言-随机数和抽样
摘要:前言   在Matlab、R或者S PLUS等软件中做随机数模拟时,经过会遇到set.seed()这个函数。随机数的产生需要有一个随机的种子,因为用计算机产生的随机数是通过递推的方法得来的,必须有一个初始值。用同一台电脑,且在初始值和递推方法相同的情况下,可以产生相同的随机序列。 阅读全文

posted @ 2016-07-16 15:40 银河统计 阅读(28423) 评论(0) 推荐(1) 编辑

R语言-虚拟变量
摘要:R语言中生成虚拟变量/哑变量 前言    "虚拟变量" 又称虚设变量、名义变量或哑变量,用以反映质的属性的一个人工变量,是量化了的质变量,通常取值为0或1。引入哑变量可使线形回归模型变得更复杂,但对问题描述更简明,一个方程能达到俩个方程的作用,而且接近现实。 目录  1 阅读全文

posted @ 2016-06-24 11:36 银河统计 阅读(15862) 评论(0) 推荐(0) 编辑

R语言-数据整形之导入导出
摘要:R语言数据导入和导出 前言   福尔·摩斯曾说过:“数据,数据,没有数据的推理是罪恶!”不过比起有意思的统计分析,数据的导入与导出显得十分的无趣,但是不得不说统计分析的数据导入与导出是个让人沮丧的任务,而且耗时巨大。今天分享的是R中数据的输出与一些特定格式的数据读入。 目录 &e 阅读全文

posted @ 2016-06-23 11:09 银河统计 阅读(2566) 评论(0) 推荐(0) 编辑