摘要: 一般Excel就能实现根据相同的列或ID合并不同的文件,但对于大文件来说,比如几十个G的数据量,用Excel处理,不仅耗时,而且还会使电脑崩溃。R语言的优势就体现在这里了,处理大文件相当快。 注意:使用merge函数合并文件时,要把文件转化为数据框格式(data.frame) 阅读全文
posted @ 2017-01-18 17:55 橙子牛奶糖 阅读(8098) 评论(0) 推荐(0)
摘要: 假设我们现在有CC,CG,GG三种基因型及三种基因型对应的表型,我们现在想要画出不同的基因型对应表型的棒状图及误差棒。整个命令最重要的就是最后一句了,用arrows函数画误差棒。用到的R语言如下: 效果图如下: 阅读全文
posted @ 2017-01-18 17:04 橙子牛奶糖 阅读(4644) 评论(0) 推荐(0)
摘要: 楼主跑以下程序时分别弹出了“fastq_quality_filter: Invalid quality score value (char '.' ord 46 quality value -18) on line 12”和“fastq_quality_filter: Invalid quality 阅读全文
posted @ 2017-01-10 16:20 橙子牛奶糖 阅读(612) 评论(0) 推荐(0)
摘要: 外显子测序时带有adapt接头,因此我们需要去除adapt接头,cutadapt的作用是去除adapt接头,一般用到如下命令: “-a”参数表明后面跟着的“AACCGGTT”是我们想要去除的adapt接头,如果你的外显子接头为其他序列,请将“AACCGGTT”改为你想去除的adapt接头; “-o” 阅读全文
posted @ 2017-01-09 15:05 橙子牛奶糖 阅读(2444) 评论(0) 推荐(1)
摘要: 出现这种问题时,一般要加上以下命令: 运行成功后,再将twobit格式转化为fa格式 阅读全文
posted @ 2016-12-27 18:43 橙子牛奶糖 阅读(478) 评论(0) 推荐(0)
摘要: 最近跑程序时出现了这么一个问题: 出现此问题一般都是数据量太大,同时跑太多程序造成的,比如我经常会同时打开十多个终端界面,跑不同的脚本,就容易出现这种问题。解决方法很简单,不要同时跑这么多程序,一个个跑。 阅读全文
posted @ 2016-12-27 12:09 橙子牛奶糖 阅读(22763) 评论(0) 推荐(1)
摘要: 效果图如下: 阅读全文
posted @ 2016-12-25 16:18 橙子牛奶糖 阅读(2090) 评论(0) 推荐(1)
摘要: 如文章“Genome-wide Complex Trait Analysis(GCTA)-全基因组复杂性状分析”中介绍的GCTA,是一款基于全基因组关联分析发展的分析工具,除了计算不同性状/表型间(traits)的遗传相关性外,还可以计算亲缘关系、近交系数……,下面简单介绍如何利用GCTA计算不同性 阅读全文
posted @ 2016-12-25 16:05 橙子牛奶糖 阅读(9046) 评论(44) 推荐(5)
摘要: 遗传方差:遗传方差又称表型方差(phenotypic variance),通常结合基因型方差(genotype variance)和环境方差(environmental variance)。遗传方差主要包括三方面:加性遗传方差(Additive genetic variance)、显性遗传方差(Do 阅读全文
posted @ 2016-12-20 16:12 橙子牛奶糖 阅读(8184) 评论(0) 推荐(1)
摘要: 全基因组关联分析流程: 一、准备plink文件 1、准备PED文件 PED文件至少有六列,内容如下: Family ID Individual ID Paternal ID Maternal ID Sex (1=male; 2=female; other=unknown) Phenotype(-9 阅读全文
posted @ 2016-11-23 21:47 橙子牛奶糖 阅读(24274) 评论(7) 推荐(3)