序列比对之Biostrings包
摘要:基本概念 Biostrings包很重要的3个功能是进行Pairwise sequence alignment 和Multiple sequence alignment及 Pattern finding in a sequence 序列比对一般有2个过程: 1)构建计分矩阵公式(the scoring
阅读全文
序列下载及处理之seqinr包
摘要:缺点:需要联网,经常出错,不是操作问题而是因为网络问题 安装 ###Retrieving a sequence and write into FASTA file### 1) 选择要去fetch序列的数据库(这里已genebank为例) 2)一旦选择好了数据库,用query信息进行收索 3)查看qu
阅读全文
edgeR
摘要:1)简介 edgeR作用对象是count文件,rows 代表基因,行代表文库,count代表的是比对到每个基因的reads数目。它主要关注的是差异表达分析,而不是定量基因表达水平。 edgeR works on a table of integer read counts, with rows co
阅读全文
clusterProfiler包
摘要:1)enrichGO:(GO富集分析) 描述:GO Enrichment Analysis of a gene set. Given a vector of genes, this function will return the enrichment GO categories after FDR
阅读全文
kegg富集分析之:KEGGREST包(9大功能)
摘要:这个包依赖极有可能是这个:https://www.kegg.jp/kegg/docs/keggapi.html ,如果可以看懂会很好理解 由于KEGG数据库分享数据的策略改变,因此KEGG.db包不在能用,推荐KEGGREST包 But a number of years ago,KEGG chan
阅读全文
topGO
摘要:前面我们讲过GO.db这个包,现在接着延伸topGO包,该包是用来协助GO富集分析 1)安装 2)使用方法 该包主要有三个使用步骤: 2.1、Data preparation:准备数据集,用于构建 topGOdata.对象。 2.1.1、包括gene标识符(List of genes identifi
阅读全文
GO.db
摘要:相似的基因在不同物种中,其功能往往保守的。显然,需要一个统一的术语用于描述这些跨物种的同源基因及其基因产物的功能,否则,不同的实验室对相同的基因的功能的描述不同,将极大限制学术的交流。而 Gene Ontology (GO) 项目正是为了能够使对各种数据库中基因获基因产物功能描述相一致的努力结果。一
阅读全文
Bioconductor应用领域之基因芯片
摘要:引用自https://mp.weixin.qq.com/s?__biz=MzU4NjU4ODQ2MQ==&mid=2247484662&idx=1&sn=194668553f954e231f4526f5c944a195&chksm=fdf84cb4ca8fc5a2c0e8355377f9d6abdc
阅读全文
org.Hs.eg.db包简介(转换NCBI、ensemble等数据库中基因ID,symbol等之间的转换)
摘要:1)安装载入 if("org.Hs.eg.db" %in% rownames(installed.packages()) == FALSE) {source("http://bioconductor.org/biocLite.R");biocLite("org.Hs.eg.db")}suppress
阅读全文
Bioconductor的历史
摘要:Bioconductor 1)简介Bioconductor项目始于2001年达纳法伯癌症研究所。 高科技产业多学科研究基金会为该项目提供支持。 2)目的Bioconductor项目的广泛目标是在计算生物学中实现良好的数据分析和推理实践,并提供一个平台,使科学家(生物学家和统计学家)能够开发和快速部署
阅读全文
利用R求分位数及画出箱型图
摘要:1)数据集 data<-c(75.0,64.0,47.4,66.9,62.2,62.2,58.7,63.5,66.6,64.0,57.0,69.0,56.9,50.0,72.0) 默认是四分位:quantile(data) 求某个百分位:例如90% 求两个百分位:例如,10%,90% 产生一系列的等
阅读全文
利用R产生随机数
摘要:生成随机数有两个函数runif()和rnorm(),其中r表示的是random随机的意思,unif表示的是均匀分布,而norm表示的是正态分布。 1)生成10个2到3之间的,服从均匀分布的随机数:runif(10,2,3);服从正态分布的随机数:rnorm(10,2,3) 因为是随机的,所以每次的结
阅读全文
绘制pathway富集散点图
摘要:本文转载自http://www.omicshare.com/forum/forum.php?mod=viewthread&tid=146&extra=page%3D1%26filter%3Dtypeid%26typeid%3D18 library(ggplot2)pathway = read.tab
阅读全文
计算相关性系数
摘要:转自:http://www.omicshare.com/forum/thread-741-1-1.html 范例文件(txt)是一个20个样本,30个基因的表达量表格矩阵。每一行是1个基因,每一列对应1个样本。 这是一个典型的数据框文件。现在我要计算两两样本间的表达量的相关系数,并且对相关系数的结果
阅读全文
用R包中heatmap画热图
摘要:一:导入R包及需要画热图的数据 library(pheatmap) data<- read.table("F:/R练习/R测试数据/heatmapdata.txt",head = T,row.names=1,sep="\t") 二:画图 1)pheatmap(data)#默认参数 2)pheatma
阅读全文
用R画韦恩图
摘要:#导入R包 library(grid)library(futile.logger)library(VennDiagram) #建立测试数据集 A = 1:150B = c(121:170,300:320)C = c(20:40,141:200)Length_A<-length(A)Length_B<
阅读全文