11 2013 档案

摘要:我们已经知道要分析的数据对每个基因有3个重复测定值,经过缺失值填充后,每个基因都有3个可用值。这一步很简单,就是取这3个值的中位数,即median。方法很多,在excel中可以用median函数;在R中以下代码进行操作:get_mediandim(imputeddata)[1] 11571 20>d... 阅读全文
posted @ 2013-11-27 09:51 hzs319 阅读(291) 评论(0) 推荐(0)
摘要:上次进行了芯片内的归一化,但是我们的数据来自于10张芯片,为了让这10张芯片之间有可比性,需要进行芯片间归一化。具体原理就不介绍了。这里用到Bioconductor的一个package,叫做limma,以及其中的函数normalizeBetweenArrays()由于normalizeBetween... 阅读全文
posted @ 2013-11-27 09:50 hzs319 阅读(444) 评论(0) 推荐(0)
摘要:经过一系列的预处理,包括缺失值填充,中位数计算以及归一化,我们的数据终于可以用啦。下面我们就来分析一下new population和old population的个体是否有差异表达基因。判断一个基因是否差异表达有许多方法,最早使用的就是看log ratio的绝对值是否大于2,这种方法早已废弃。下一个... 阅读全文
posted @ 2013-11-27 09:48 hzs319 阅读(687) 评论(0) 推荐(0)
摘要:归一化是从normalization翻译过来的。归一化的目的是使各次/组测量或各种实验条件下的测量可以相互比较,消除测量间的非实验差异。非实验差异可能来源于样品制备,点样,杂交过程,杂交信号处理等。归一化的方法有很多,对于寡聚核苷酸芯片(单通道,以Affymetrix为代表)和cDNA芯片(双通道,... 阅读全文
posted @ 2013-11-27 09:47 hzs319 阅读(808) 评论(0) 推荐(0)
摘要:以下分析用到的数据可以在这里(http://dl.getdropbox.com/u/308058/blog/raw_data_3_replicates.txt)下载,这个数据来自关于基因对蝴蝶迁移性的研究,样本是20个蝴蝶个体,其中10个是当地固有个体(old),另外10个是新迁入的个体(new),... 阅读全文
posted @ 2013-11-27 09:43 hzs319 阅读(900) 评论(0) 推荐(0)
摘要:我之前一直专注于单一的随机变量及其概率分布。现在开始考虑多个随机变量的情况。联合分布(joint distribution)描述了多个随机变量的概率分布,是对单一随机变量的自然拓展。联合分布的多个随机变量都定义在同一个样本空间中。多个随机变量并存离散随机变量的联合分布我们先从离散的情况出发,了解多个... 阅读全文
posted @ 2013-11-22 10:19 hzs319 阅读(1541) 评论(0) 推荐(0)
摘要:3.1 随机模拟随机模拟(或者统计模拟)方法有一个很酷的别名是蒙特卡罗方法(Monte Carlo Simulation)。这个方法的发展始于20世纪40年代,和原子弹制造的曼哈顿计划密切相关,当时的几个大牛,包括乌拉姆、冯.诺依曼、费米、费曼、Nicholas Metropolis, 在美国洛斯阿... 阅读全文
posted @ 2013-11-22 10:11 hzs319 阅读(335) 评论(0) 推荐(0)
摘要:BLASTALL 用法a.格式化序列数据库格式化序列数据库— —formatdbformatdb简单介绍:formatdb处理的都是格式为 ASN.1和 FASTA,而且不论是核苷酸序列数据库,还是蛋白质序列数据库;不论是使用Blastall ,还是Blastpgp,Mega Blast应用程序,这... 阅读全文
posted @ 2013-11-21 11:05 hzs319 阅读(3757) 评论(0) 推荐(0)
摘要:linux下有很多能快速操作文件的命令,整理几个常用的:1、拆分文件(按行拆分 -l,按大小拆分 -b ,后面可加单位:b、k、m等):c:/shell/split.exe -l 3000000 bigfileName /destinationDir/prefix--- 我是在window环境下使用... 阅读全文
posted @ 2013-11-06 16:41 hzs319 阅读(832) 评论(0) 推荐(0)
摘要:谁说数学是枯燥的?在数学里,有很多欢乐而又深刻的数学定理。这些充满生活气息的数学定理,不但深受数学家们的喜爱,在数学迷的圈子里也广为流传。喝醉的小鸟定理:喝醉的酒鬼总能找到回家的路,喝醉的小鸟则可能永远也回不了家。假设有一条水平直线,从某个位置出发,每次有 50% 的概率向左走1米,有50%的概率向... 阅读全文
posted @ 2013-11-06 13:13 hzs319 阅读(402) 评论(0) 推荐(0)
摘要:概率论只不过是把常识用数学公式表达了出来。——拉普拉斯记得读本科的时候,最喜欢到城里的计算机书店里面去闲逛,一逛就是好几个小时;有一次,在书店看到一本书,名叫贝叶斯方法。当时数学系的课程还没有学到概率统计。我心想,一个方法能够专门写出一本书来,肯定很牛逼。后来,我发现当初的那个朴素归纳推理成立了——... 阅读全文
posted @ 2013-11-03 12:54 hzs319 阅读(192) 评论(0) 推荐(0)