摘要:1.概述 |矩阵|函数| |: :|: :| |表达矩阵|lmFit| |分组矩阵|eBayes| |差异比较矩阵|topTable| 2.读取表达矩阵: 得到表达矩阵exprSet,它的列是各个样本名称,行是各个探针ID,一个纯粹的表达矩阵,必须是数字型的! 可以简单地做一下该表达矩阵的QC检测:
阅读全文
摘要:VCF是用于描述SNP,INDEL和SV结果的文件,下面所记录的是以GATK软件结果的VCF文件,与SAMtools的结果有点不同 VCF文件可以分为两部分看,最上面 号注释的的部分是对一些参数的解释(看英文能懂的话,下面的解释就不用看了),而下面没 号注释的部分则是各个参数对应的具体的值 一般先关
阅读全文
摘要:VCF文件示例(VCFv4.2) CHROM: 表示变异位点是在哪个contig 里call出来的,如果是人类全基因组的话那就是chr1…chr22,chrX,Y,M。 POS: 变异位点相对于参考基因组所在的位置,如果是indel,就是第一个碱基所在的位置。 ID: 如果call出来的SNP存在于
阅读全文
摘要:一、建立公钥和私钥对 命令:ssh-keygen -t rsa 按Enter键,连续三次,默认存储路径及文件 在/home/.ssh/目录下,多了两个文件id_rsa和id_rsa.pub,分别是私钥和公钥,这里我们只需要公钥即可。 二、把公钥传到另一个主机 三、将id_rsa公钥的内容添加到.ss
阅读全文
摘要:定义 MAD(Median absolute deviation, 中位数绝对偏差)是单变量数据集中样本差异性的稳健度量。mad是一个健壮的统计量,对于数据集中异常值的处理比标准差更具有弹性,可以大大减少异常值对于数据集的影响。 对于单变量数据集 X={X1,X2,X3,...,Xn},mad的计算
阅读全文
摘要:导读:随着二代测序技术临床应用的不断增加,越来越多与癌症发生发展密切相关的突变被鉴定出来。将基因突变的结果更好地转化为实际临床应用,统一而通用的突变命名规则就显得尤为重要。人类基因组变异协会(HGVS:Human Genome Variation Society)规则是目前学术界所公认的命名规则。
阅读全文
摘要:In multicellular organisms, mutations can be classed as either somatic or germ-line: Somatic mutations – occur in a single body cell and cannot be inh
阅读全文
摘要:Why these steps are necessary The GATK uses two files to access and safety check access to the reference files: a .dict dictionary of the contig names
阅读全文
摘要:Somatic突变是不遗传的,在研究方法上主要偏重采集癌症组织和正常组织进行比较得到结果(在Call Somatic mutations 的时候最好有同一个体的正常组织进行参照)从研究意义上来讲,Somatic更偏重于单个患者的癌症分型和发病机理的研究。相对比较省事儿。 Germ-line的muta
阅读全文