2013年5月4日

摘要: 离上一次组会汇报有半年左右时间了~ 总体来说还是比上一次强不少的,不过,还有很多需要提高的地方:1. 英语英语的重要性怎么强调都不为过,在没有达到NATIVE的水平前,总是还需要不断学习、练习的。2. Background这次presentation背景介绍的不够。的确,做ppt的时候总是assume别人跟你一样熟悉这个topic。其实,他们往往对你做的东西知之甚少,你必须讲的很明白。Ite说的很对:仅仅介绍ABCA的作用不行,还要介绍它敲出后,小鼠死掉;heterozygous小鼠有hyperplasia等等这些信息,才能够让人知道你为什么要去研究这个基因。3. method总体来讲,met 阅读全文
posted @ 2013-05-04 05:28 Forever_YCC 阅读(199) 评论(0) 推荐(0) 编辑

2013年5月2日

摘要: 基本能够比较熟练地操作Linux和Windows,但是Mac还是不很熟练,今天也在Mac上面折腾了不少时间。Homer是一个分析DNA motif的程序,需要先安装,再使用。首先,来这里http://biowhat.ucsd.edu/homer/introduction/install.html下载一个安装脚本configureHomer.pl.cd到所在目录,然后 perl configureHomer.pl -install即可安装当然,它会有一些dependency,所以需要下载一些dependency如samtools、blat等等(需要仔细看说明)后即可接着,安装好后会给你一个pat 阅读全文
posted @ 2013-05-02 03:00 Forever_YCC 阅读(1649) 评论(0) 推荐(0) 编辑
摘要: 1. How to open a text file in terminal: open -a TextEdit filename2. How to open a new Rstudio: open -n /Application/Rstudio.app3. How to visualize... 阅读全文
posted @ 2013-05-02 01:59 Forever_YCC 阅读(168) 评论(0) 推荐(0) 编辑

2013年4月30日

摘要: 用过无数R包,但是却从来没有自己写过。总觉的写R包是很困难的事情,但是其实写一个最简单的R包还是蛮容易的!今天便在Ubuntu环境下写一个R包~首先,写一个函数,存放到一个文件夹中或者直接存在R中均可OK,下一步就是在你的R中source该函数,并且使用函数setwd('My directory')package.skeleton(name="My package name", list= “My function”) #list必须是“字符串”这样R这个函数就会在你的目录中出现一个文件夹,里面有几个基本的R包的文件,按照规则填上自己的包的信息之后便可以在t 阅读全文
posted @ 2013-04-30 08:58 Forever_YCC 阅读(384) 评论(0) 推荐(0) 编辑

2013年4月27日

摘要: 常常会写一些函数来分析Microarray。而每次使用函数所用的参数都不同,因此需要一些方法能够将每次这些不同的结果以及参数存储起来。首先使用一个R内置的时间函数Sys.time():Sys.time()[1] "2013-04-26 14:15:37 PDT"#这里更改设置,输出成自己喜欢的格式:format(Sys.time(), '_%Y_%b_%dth_%H_%M')[1] "_2013_Apr_26th_14_18"#因此,可以每次程序都能够新建一个以时间为名称的文件夹(避免重复问题) dir = '/media/Res 阅读全文
posted @ 2013-04-27 05:23 Forever_YCC 阅读(476) 评论(0) 推荐(0) 编辑

2013年4月19日

摘要: 1. 怎样快速入门一个R包这两天查看了十几个R包,也算是对看R入门一个R包有一些经验了把~所有的R包都附带一个manual(有些R包还会有一个小manual,做简介用,那就更好了)。把manual下下来,看看它的最前面有没有一个对整个包general的介绍,如果有,那么一定要仔细阅读,这个非常重要!它会把整个包的大致情况介绍:要解决什么问题,用什么算法解决的......另外,它还会介绍最重要的函数(其实一个R包经常用到的函数不会一般超过五个!)了解这些信息,便很容易上手了~但是并不是所有的R包都会有这样一个对本包的概述,对于这样的情况,可以在R包的主页上面找一个‘citation'的东 阅读全文
posted @ 2013-04-19 03:55 Forever_YCC 阅读(12892) 评论(0) 推荐(0) 编辑

2013年4月18日

摘要: 1. getAnywhere: getAnywhere(函数名)可以返回这个函数的代码 在看一些函数的时候总是找不到它的源代码,直接在R console中敲函数 的名字,有些函数是可以直接显示所有代码,但是有些却不能。对于那些不能的,我们使用这个函数即可~ 阅读全文
posted @ 2013-04-18 14:38 Forever_YCC 阅读(302) 评论(0) 推荐(0) 编辑
摘要: DNA microarray分析中,聚类分析(clustering analysis)是非常重要的一步。今天学习了Pan Ning Tan的introduction to data mining ,进行一下总结:1. 聚类分析的分类1) 按照是否有层次:层次聚类(hierarchical clustering)划分聚类(partitioninng clustering)2)按照是否依据模型:non-parameter clustering:没有默认的assumption整个数据集是由哪几种分布mix的model-based clustering: 基于模型的聚类认为不同的‘类’有不同的‘分布’ 阅读全文
posted @ 2013-04-18 10:45 Forever_YCC 阅读(446) 评论(0) 推荐(0) 编辑

2013年4月16日

摘要: 以前只是知道R 中的lm函数能够做线性拟合,恰如函数的名字:lm= linear model不过今天需要做非线性拟合的时候, 上网搜各种函数,包括nls、nlm等等,不过nlm的用法好像和一般的建模函数不太相同;nls函数的用法倒很像,可是却总是出error,不知道为什么。再次苦找,忽然发现其实lm函数便可以完成这个工作:lm函数进行非线性拟合的本质是在其中加入非线性的变量,对这些非线性的变量进行线性拟合,结果还是非线性的。library(car)plot(USPop)lmfit = lm(population ~ year, data = USPop) #线性拟合lines(USPop$ye 阅读全文
posted @ 2013-04-16 09:03 Forever_YCC 阅读(22049) 评论(0) 推荐(0) 编辑

2013年4月9日

摘要: 今天快速浏览了一遍Bioconductor Case Studies这本书的前半部分,大有相见恨晚之感。里面系统地阐释了很多microarray的东西,让我之前的一些疑问得到冰释。1. 对于单通道microarray来讲,一般的预处理往往由三个步骤组成: a) background correction: 把背景噪声去掉。 b) between array normalization: 每个芯片之间由于加样量、操作以及本身芯片制作时产生的差别,会有所不同,因此,将不同芯片之间进行标准化(normalization)后比较,才能更真实地反映出差别。 c) reporter summarizati 阅读全文
posted @ 2013-04-09 08:13 Forever_YCC 阅读(428) 评论(0) 推荐(0) 编辑

导航