随笔分类 - R
摘要:今天介绍一些运算函数,它们的使用很简单,没有什么难度,但是也会用的着。 在医学统计学或者流行病学里的现场调查、样本选择经常会提到一个词:随机抽样。随机抽样是为了保证各比较组之间均衡性的一个很重要的方法。那么今天介绍的第一个函数就是用于抽样的函数sample: > x=1:10 > sample(x=
阅读全文
摘要:R的包(package)通常有两种:1 binary package:这种包属于即得即用型(ready-to-use),但是依赖与平台,即Win和Linux平台下不同。2 Source package: 此类包可以跨平台使用,但用之前需要处理或者编译(compiled)。.libPaths():查看
阅读全文
摘要:摘自 方匡南 等编著《R数据分析-方法与案例详解》.电子工业出版社R包简介R包提供了一个加载所需代码、数据和文件的集合。R软件自身就包含大约30种不同功能的包,这些基本包提供了R软件的基本功能。与此同时,R作为一个开源软件,它提供了各种统计计算函数,从而方便使用者能够灵活机动的进行数据分析,甚至创造
阅读全文
摘要:https://www.zhihu.com/question/24501195 节选: 看了这么多答案,觉得 Hadley Wickhamhad.co.nz 在R使用者的地位好高啊。其实我也觉得Hadley的每个包都很好用,尤其是CRAN - Package plyr(他写的包中,这个接触得比较晚,
阅读全文
摘要:在用R语言做各种事物时,用户自定义函数是不可或缺的。这期来讲讲如何自定义R的function。首先要介绍的是function的基本框架: 1 2 3 4 函数名称为myfunction arg1,arg2 为参数 statements 为函数语句 return(object)返回结果 两个例子 例子
阅读全文
摘要:我们趋势分析的方法,其实参照一款非常有名软件STEM(Short Time-series Expression Miner,下载地址:http://www.sb.cs.cmu.edu/stem/)。这个软件的主要用途就是针对时间顺序取样的表达量数据进行聚类,分析其表达模式。如果你使用我们的趋势分析工
阅读全文
摘要:http://blog.sciencenet.cn/blog-2985160-948631.html 我们在做人类全基因组分析的时候,经常需要找出基因组中所有基因的转录起始位点(Transcription Start Site, TSS),利用R/Bioconductor很容易做到。 用到一个包 H
阅读全文
摘要:下面用实例来说明这两个函数的作用: 这是一个数据框final: gene hsap mmul mmus rnor cfam 1 ENSG00000208234 0 NA NA NA NA 2 ENSG00000199674 0 2 2 2 2 3 ENSG00000221622 0 NA NA NA
阅读全文
摘要:1、综述 越来越多的R包正在由世界上不同的人所创建,其中一部分原因是devtools包使得开发R包1变得更加简单。devtools包不仅让开发R包变得简单,而且用于分发R包。 当开发者发布一个R包的时候,CRAN2一般是最常用的。使用install.packages()函数可以安装发布在CRAN上的
阅读全文
摘要:我们在做数据分析的时候,对数据进行操作也是一项极其重要的内容,这里我们同样介绍强大包reshape2,其中的几个函数,对数据进行操作cast和melt两个函数绝对少不了。 首先是cast,把长型数据转换成你想要的任何宽型数据, dcast(data, formula, fun.aggregate =
阅读全文
摘要:尽管R是一门以数值向量和矩阵为核心的统计语言,但字符串有时候也会在数据分析中占到相当大的份量。 R语言是一个擅长处理数据的语言,但是也不可避免的需要处理一些字符串(文本数据)。如何高效地处理文本数据,将看似杂乱无章的数据整理成可以进行统计分析的规则数据,是『数据玩家』必备的一项重要技能。 在编程语言
阅读全文
摘要:R中的grep、grepl、sub、gsub、regexpr、gregexpr等函数都使用正则表达式的规则进行匹配。默认是egrep的规则,也可以选用Perl语言的规则。在这里,我们以R中的sub函数为例(因为该函数可以返回替换字符串后的具体内容)介绍正则表达式的用法。 对该函数的逻辑参数都使用默认
阅读全文
摘要:https://github.com/twbattaglia/RNAseq-workflow
阅读全文
摘要:最近需要下载一大批GEO上的数据,问题是我要下载的Methylation数据根本就没有sra文件,换言之不能使用Aspera之类的数据进行下载。但是后来我发现了GEOquery这个不错的R包,不知道是网络问题还是怎么,GEOquery有时候运行也不太稳定,但是总体来说,很好地解决了我的问题。 首先假
阅读全文
摘要:biomart 重器 biomaRt工具包的作用在于它可以轻松地完成的在多个生物学数据库上繁琐地检索,获取相关数据在不同数据库间的关联。
阅读全文
摘要:与R语言纠缠了一个星期,从快速上手的暗暗得意,到之后某些细节的纠结烦躁,过山车式体验中,我逐渐才认识了真实的R语言。 期间遇到两个很烦恼的问题,一个是让人烦躁抓狂,另一个是无意发现的重大错误。 1. 令人抓狂的rownames 若数据矩阵datamatrix如图1,无列名和行名及表头。若c1~c4分
阅读全文
摘要:http://blog.csdn.net/cashey1991/article/details/7001385 @1.首先从下面这个菜单打开工程panel @2.在工程panel的“Workspace”上右击: Add New Project 并命名后,可以在新的工程上右击,添加文件,有多种添加方式
阅读全文


浙公网安备 33010602011771号