上一页 1 ··· 215 216 217 218 219 220 221 222 223 ··· 341 下一页
摘要: 接前一篇: 用R和BioConductor进行基因芯片数据分析(三):计算median 归一化是从normalization翻译过来的。归一化的目的是使各次/组测量或各种实验条件下的测量可以相互比较,消除测量间的非实验差异。非实验差异可能来源于样品制备,点样,杂交过程,杂交信号处理等。 归一化的方法有很多,对于寡聚核苷酸芯片(单通道,以Affymetrix为代表)和cDNA芯片(双通道,红绿染... 阅读全文
posted @ 2012-12-05 16:55 emanlee 阅读(10430) 评论(0) 推荐(0)
摘要: 接前一篇: http://www.cnblogs.com/emanlee/archive/2012/12/05/2803144.html 我们已经知道要分析的数据对每个基因有3个重复测定值,经过缺失值填充后,每个基因都有3个可用值。 这一步很简单,就是取这3个值的中位数,即median。 方法很多,在excel中可以用median函数; 在R中以下代码进行操作: get_media... 阅读全文
posted @ 2012-12-05 16:23 emanlee 阅读(4155) 评论(0) 推荐(0)
摘要: 以下分析用到的数据可以在这里(http://dl.getdropbox.com/u/308058/blog/raw_data_3_replicates.txt )下载,这个数据来自关于基因对蝴蝶迁移性的研究,样本是20个蝴蝶个体,其中10个是当地固有个体(old),另外10个是新迁入的个体(new),old和new个体两两随机配对,分别用不同颜色染料(波长分别为555和647nm)标记后,在同一张基因芯片上杂交;此外,每个基因在每张芯片上都重复点样3次,因此此数据是有3个replicates及10张芯片的双通道芯片。数据是样点的信号强度值,没有经过标准化处理的。拿到数据你会看到许多”NA”,这 阅读全文
posted @ 2012-12-05 15:09 emanlee 阅读(9724) 评论(2) 推荐(0)
摘要: R是开源的统计计算和作图语言,与S语言很相似。R的语法与其他语言很相似,功能很强大,可以到这里看看截图。主页是 http://www.r-project.org/ 可以点击这里下载R,这里有很权威的英文教程。本站提供几本中文教程(pdf)的打包下载,更多的随便搜索一下就可以找到。 BioConductor是建立在R语言环境上的生物芯片数据和基因组数据分析软件包,主页是 http://www... 阅读全文
posted @ 2012-12-05 14:33 emanlee 阅读(9264) 评论(0) 推荐(0)
摘要: bioconductor 包的安装安装R,并启动R。 > source("http://bioconductor.org/biocLite.R") > biocLite() Using R version 2.10.0 (R-devel), biocinstall version ... 阅读全文
posted @ 2012-12-05 00:19 emanlee 阅读(8532) 评论(0) 推荐(0)
摘要: R语言数据储存与读取 1 首先用getwd() 获得当前目录,用setwd("C:/data")设定当前目录 2 数据保存 创建数据框d >d <- data.frame(obs = c(1, 2, 3), treat = c("A", "B", "A"), weight = c(2.3, NA, 阅读全文
posted @ 2012-12-04 23:49 emanlee 阅读(101296) 评论(0) 推荐(3)
摘要: word 2003中无格式粘贴的设置方法 打开Word窗口,依次点击“工具/宏/Visual Basic编辑器”, 打开“Microsoft visual Basic”窗口,在左侧“工程”栏选中“Normal”选项,点击“插入/模块”选项打开一个模块窗口, 输入以下代码: Sub 无格式粘贴() Selection.PasteAndFormat(wdForma... 阅读全文
posted @ 2012-12-01 16:09 emanlee 阅读(23427) 评论(0) 推荐(1)
摘要: 勤奋在科研中究竟有多重要?我的回答是:重要,也不重要。 成功需要坚持木桶理论,每块板都很重要,但每根板又有特性区别。相对于其他行业,你若想在生物医学领域有所建树,勤奋这块板就相当于那个木桶底板,没了它,其他板再好再结实也没有用。但除此之外,其他因素也很重要,比如眼光。如果拿跑步来比喻,眼光就是跑的方向,勤奋就是跑的速度和时间。方向如果选择正确的话,越勤奋越能领先别人到达终点,但方向如果错误的话,... 阅读全文
posted @ 2012-11-27 19:38 emanlee 阅读(1444) 评论(0) 推荐(1)
摘要: 一、什么是大型网站运维? 首先明确一下,全文所讲的”运维“是指:大型网站运维,与其它运维的区别还是蛮大的;然后我们再对大型网站与小型网站进行范围定义,此定义主要从运维复杂性角度考虑,如网站规范、知名度、服务器量级、pv量等考虑,其它因素不是重点;因此,我们先定义服务器规模大于1000台,pv每天至少上亿(至少国内排名前10),如sina、baidu、QQ,51.com等等;其它小型网站可能没有... 阅读全文
posted @ 2012-11-18 09:15 emanlee 阅读(932) 评论(2) 推荐(0)
摘要: 随着中国大型IT企业信息化速度的加快,大部分应用的数据量和访问量都急剧增加,大型企业网站正面临性能和高数据访问量的压力,而且对存储、安全以及信息检索等等方面都提出了更高的要求…… 本文中,我想通过几个国外大型IT企业及网站的成功案例,从Web技术人员角度探讨如何积极地应对国内大型网站即将面临的扩展(主要是技术方面,而较少涉及管理及营销等方面)矛盾。一、 国外大型IT网站的成功之道 MySpace 今天,MySpace已经成为全球众口皆碑的社区网站之王。尽管一流和营销和管理经验自然是每个IT企业取得成功的首要因素,但是本节中我们却抛弃这一点,而主要着眼于探讨在数次面临系统扩张的紧急关头MySp. 阅读全文
posted @ 2012-11-17 17:43 emanlee 阅读(2916) 评论(0) 推荐(1)
上一页 1 ··· 215 216 217 218 219 220 221 222 223 ··· 341 下一页