随笔分类 -  生息分析

摘要:1.概述 |矩阵|函数| |: :|: :| |表达矩阵|lmFit| |分组矩阵|eBayes| |差异比较矩阵|topTable| 2.读取表达矩阵: 得到表达矩阵exprSet,它的列是各个样本名称,行是各个探针ID,一个纯粹的表达矩阵,必须是数字型的! 可以简单地做一下该表达矩阵的QC检测: 阅读全文

posted @ 2020-03-09 14:45 萧飞IDO 阅读(2238) 评论(0) 推荐(0)

摘要:VCF是用于描述SNP,INDEL和SV结果的文件,下面所记录的是以GATK软件结果的VCF文件,与SAMtools的结果有点不同 VCF文件可以分为两部分看,最上面 号注释的的部分是对一些参数的解释(看英文能懂的话,下面的解释就不用看了),而下面没 号注释的部分则是各个参数对应的具体的值 一般先关 阅读全文

posted @ 2020-01-07 10:33 萧飞IDO 阅读(2072) 评论(0) 推荐(0)

摘要:VCF文件示例(VCFv4.2) CHROM: 表示变异位点是在哪个contig 里call出来的,如果是人类全基因组的话那就是chr1…chr22,chrX,Y,M。 POS: 变异位点相对于参考基因组所在的位置,如果是indel,就是第一个碱基所在的位置。 ID: 如果call出来的SNP存在于 阅读全文

posted @ 2019-11-12 21:05 萧飞IDO 阅读(1699) 评论(0) 推荐(0)

摘要:一、建立公钥和私钥对 命令:ssh-keygen -t rsa 按Enter键,连续三次,默认存储路径及文件 在/home/.ssh/目录下,多了两个文件id_rsa和id_rsa.pub,分别是私钥和公钥,这里我们只需要公钥即可。 二、把公钥传到另一个主机 三、将id_rsa公钥的内容添加到.ss 阅读全文

posted @ 2018-03-11 18:19 萧飞IDO 阅读(369) 评论(0) 推荐(0)

摘要:定义 MAD(Median absolute deviation, 中位数绝对偏差)是单变量数据集中样本差异性的稳健度量。mad是一个健壮的统计量,对于数据集中异常值的处理比标准差更具有弹性,可以大大减少异常值对于数据集的影响。 对于单变量数据集 X={X1,X2,X3,...,Xn},mad的计算 阅读全文

posted @ 2018-03-10 20:04 萧飞IDO 阅读(9545) 评论(0) 推荐(0)

摘要:导读:随着二代测序技术临床应用的不断增加,越来越多与癌症发生发展密切相关的突变被鉴定出来。将基因突变的结果更好地转化为实际临床应用,统一而通用的突变命名规则就显得尤为重要。人类基因组变异协会(HGVS:Human Genome Variation Society)规则是目前学术界所公认的命名规则。 阅读全文

posted @ 2018-03-08 18:41 萧飞IDO 阅读(4990) 评论(1) 推荐(0)

摘要:In multicellular organisms, mutations can be classed as either somatic or germ-line: Somatic mutations – occur in a single body cell and cannot be inh 阅读全文

posted @ 2018-03-07 16:33 萧飞IDO 阅读(436) 评论(0) 推荐(0)

摘要:Why these steps are necessary The GATK uses two files to access and safety check access to the reference files: a .dict dictionary of the contig names 阅读全文

posted @ 2017-12-07 09:32 萧飞IDO 阅读(1526) 评论(0) 推荐(0)

摘要:Somatic突变是不遗传的,在研究方法上主要偏重采集癌症组织和正常组织进行比较得到结果(在Call Somatic mutations 的时候最好有同一个体的正常组织进行参照)从研究意义上来讲,Somatic更偏重于单个患者的癌症分型和发病机理的研究。相对比较省事儿。 Germ-line的muta 阅读全文

posted @ 2017-06-26 14:13 萧飞IDO 阅读(4181) 评论(0) 推荐(0)

导航