摘要: 芯片质量分析芯片数据预处理获取差异表达基因GO和KEGG分析聚类分析(本文于2013.09.04更新)基因芯片技术的特点是使用寡聚核苷酸探针检测基因。前一节使用ReadAffy函数读取CEL文件获得的数据是探针水平的(probe level),即杂交信号,而芯片数据预处理的目的是将杂交信号转成表达数... 阅读全文
posted @ 2014-02-24 10:17 hzs319 阅读(1600) 评论(0) 推荐(0)
摘要: 在多元相关分析中,简单相关系数可能不能够真实的反映出变量X和Y之间的相关性,因为变量之间的关系很复杂,它们可能受到不止一个变量的影响。这个时候偏相关系数是一个更好的选择。偏相关系数是在排除了其他变量的影响下计算变量间的相关系数。假设我们需要计算X和Y之间的相关性,Z代表其他所有的变量,X和Y的偏相关... 阅读全文
posted @ 2014-02-19 09:24 hzs319 阅读(1225) 评论(0) 推荐(0)
摘要: 基础ls()显示内存中的对象rm()删除内存中对象,rm(list=ls())删除全部?lm显示帮助help(lm)帮助getwd()获取当前工作目录setwd("C:/data")改变工作目录从外部文件中读取数据mydata=5] =5的值替换成20下标还可以是logical类型的FALSE或TR... 阅读全文
posted @ 2014-02-12 10:50 hzs319 阅读(284) 评论(0) 推荐(0)
摘要: I. 导论简单来讲,编程是借助计算机来解决某个问题。学习编程的就是训练我们解决问题的能力。有这样一种说法:在未来,不会编程的人即是文盲。1 为什么要学习R编程大部分情况下解决某些问题还需要依赖一些事实或数据,结合数据分析的框架和计算工具来帮助我们决策和判断。这时候R语言编程就会派上用场。例如从大的方... 阅读全文
posted @ 2014-02-12 10:49 hzs319 阅读(9378) 评论(0) 推荐(0)
摘要: R中的数据结构主要面向《线性代数》中的一些概念,如向量、矩阵等。值得注意的是,R中其实没有简单数据(数值型、逻辑型、字符型等),对于简单类型会自动看做长度为1的向量。比如:>b=5>length(b)[1]1>typeof(b)[1]"double">mode(b)[1]"numeric"R中最重要... 阅读全文
posted @ 2014-01-22 10:35 hzs319 阅读(370) 评论(0) 推荐(0)
摘要: 一、行列求和、平均值和频度rowSums, colSums, rowMeans, colMeans 可以简单理解为按行或列求和或求均值,table把数字或字符当成因子统计频度,都相当简单:>aa[,1][,2][,3][1,]123[2,]123[3,]123>rowSums(a)[1]666>co... 阅读全文
posted @ 2014-01-22 10:34 hzs319 阅读(584) 评论(0) 推荐(0)
摘要: 去,来,最终还是到蛋白质!PPI:protein-proteininteraction1.DIP(databaseofinteractingproteins)http://dip.doe-mbi.ucla.edu/dip/Main.cgi在页面点击Searchby:[protein][sequenc... 阅读全文
posted @ 2014-01-10 09:21 hzs319 阅读(1054) 评论(0) 推荐(0)
摘要: 摘要: 基因芯片筛选差异表达基因方法比较单文娟, 童春发, 施季森 摘要: 使用计算机模拟数据和真实的芯片数据, 对8 种筛选差异表达基因的方法进行了比较分析, 旨在比较不同方法对基因芯片数据的筛选效果。模拟数据分析表 ...基因芯片筛选差异表达基因方法比较单文娟, 童春发, 施季森摘要: 使用计算... 阅读全文
posted @ 2014-01-07 11:22 hzs319 阅读(2840) 评论(0) 推荐(0)
摘要: 生物信息学:生物信息学时应用信息科学的知识和方法,搜集、整理、贮存、分析生命科学的一门新兴学科,是现代医学生物学研究和分析的必备工具。CMBI曾就当今网上的各种专业网站及专业数据库作过报道,具体请参阅生物信息网站评述。这次CMBI再从《Bioinformatics》这一国际上最为著名的专业杂志中摘编... 阅读全文
posted @ 2013-12-03 16:00 hzs319 阅读(1906) 评论(0) 推荐(0)
摘要: 我们已经知道要分析的数据对每个基因有3个重复测定值,经过缺失值填充后,每个基因都有3个可用值。这一步很简单,就是取这3个值的中位数,即median。方法很多,在excel中可以用median函数;在R中以下代码进行操作:get_mediandim(imputeddata)[1] 11571 20>d... 阅读全文
posted @ 2013-11-27 09:51 hzs319 阅读(291) 评论(0) 推荐(0)