随笔分类 -  生信

CMplot 可视化曼哈顿,qqplot
摘要:library(CMplot) setwd("~/literature/recurring/manhat_qplot") df<-read.table("GCST90014052_buildGRCh38.tsv.gz",header=T,sep="\t") df_column<-df %>%sele 阅读全文

posted @ 2022-04-29 11:06 BioinformaticsMaster 阅读(4967) 评论(0) 推荐(0)

conditional analysis 把发现的lead SNP作为协变量看LD内是否有其他显著SNP
摘要:plink -condition https://zhuanlan.zhihu.com/p/363026493 https://www.cnblogs.com/chenwenyan/p/10278893.html 阅读全文

posted @ 2022-04-12 09:41 BioinformaticsMaster 阅读(119) 评论(0) 推荐(0)

Reference allele mismatch at chr1:1630781 .. REF_SEQ:'C' vs VCF:'T' Ref alleles mismatch between: [VC Unknown @ chr1:1630781 Q. of type=SNP alleles=[T*, C] attr={} GT=[[HG00472 T*/C]] ..
摘要:原因是待处理的vcf,他们的ref allele不一致,所以 解决方法是 bcftools norm 先统一 ref allele 如bcftools norm -c s -f /ldfssz1/ST_BIGDATA/USER/st_bigdata/Sentieon/reference_bigdat 阅读全文

posted @ 2022-03-16 21:58 BioinformaticsMaster 阅读(408) 评论(0) 推荐(0)

概率 贝叶斯公式 先验概率 后验概率
摘要:先验概率,后验概率,似然概率,条件概率,贝叶斯,最大似然总是搞混,这里总结一下常规的叫法: 先验概率: 事件发生前的预判概率。可以是基于历史数据的统计,可以由背景常识得出,也可以是人的主观观点给出。一般都是单独事件概率,如P(x),P(y)。 后验概率: 事件发生后求的反向条件概率;或者说,基于先验 阅读全文

posted @ 2022-03-15 13:05 BioinformaticsMaster 阅读(4020) 评论(0) 推荐(0)

impute
摘要:先phasing,再impute https://www.jianshu.com/p/c99702068b4a 阅读全文

posted @ 2022-03-04 10:12 BioinformaticsMaster 阅读(34) 评论(0) 推荐(0)

faidx提取fasta指定位置allele
摘要:提取指定区域的fasta 提取序列: samtools faidx input.fa chr1 > chr1.fa samtools faidx input.fa chr1:100-200 > chr1.fa 例子, samtools faidx /hwfssz1/BIGDATA_COMPUTING 阅读全文

posted @ 2022-02-17 16:36 BioinformaticsMaster 阅读(238) 评论(0) 推荐(0)

GATK GenotypeConcordance 比较vcf一致性:Sequence dictionaries are not the same size
摘要:处理多份vcf时,报GATK GenotypeConcordance:Sequence dictionaries are not the same size 解决方案:统一header中的##contig=<ID= 部分 注: 1)脚本如下 gatk --java-options -Xmx3G Ge 阅读全文

posted @ 2022-02-17 15:48 BioinformaticsMaster 阅读(383) 评论(0) 推荐(0)

GATK joint-calling 不需要手动设置--ploidy
摘要:A pooled experiment is different from joint calling. It means when you combined the DNA of many individuals and sequenced them together. The DNA is no 阅读全文

posted @ 2022-01-24 15:33 BioinformaticsMaster 阅读(273) 评论(0) 推荐(0)

NCBI的gene id, ENTREZID 与Ensembl Gene ID的转换
摘要:NCBI的gene id, ENTREZID 与Ensembl Gene ID 互相转换网站:https://biodbnet-abcc.ncifcrf.gov/db/db2db.php 还有另外一个单向 ensemble 转NCBI的:https://www.biotools.fr/human/e 阅读全文

posted @ 2021-12-24 21:51 BioinformaticsMaster 阅读(6084) 评论(0) 推荐(0)

免疫 TCR BCR 病毒滴度
摘要:病毒滴度:病毒的毒力,毒价,衡量病毒滴度的单位有最小致死量(MLD)、最小感染量(MID)和半数致死量(LD50),其中LD50最常用,指在一定时间内能使半数试验动物致死的病毒量。 免疫,即身体对感染有抵抗能力。 人体内三道免疫防线: 1. 皮肤和黏膜构成 2.杀菌物质和吞噬细胞 3.特异性免疫。 阅读全文

posted @ 2021-05-20 15:46 BioinformaticsMaster 阅读(747) 评论(0) 推荐(0)

LD plot
摘要:连锁不平衡 linkage disequilibrium (LD) 又称为等位基因关联(allelic association) 广泛的遗传关联研究依赖genetic marker和disease locus的连锁不平衡(linkage disequilibrium,LD) http://www.v 阅读全文

posted @ 2021-05-11 10:16 BioinformaticsMaster 阅读(2398) 评论(0) 推荐(0)

beta p-value SE
摘要:Beta value Beta值(β) effect size 线性回归的参数https://www.mv.helsinki.fi/home/mjxpirin/GWAS_course/material/GWAS2.html Hello Mohsin, Cohen's f-squared would 阅读全文

posted @ 2021-04-27 10:07 BioinformaticsMaster 阅读(1025) 评论(0) 推荐(0)

蛋白截断变异(protein-truncating variant,PTV)
摘要:蛋白截断变异(protein-truncating variant,PTV)通过引入终止密码子,移码突变或剪接位点,破坏蛋白编码基因[1]。蛋白截断变异的研究对于人类进化(human evolution),基因功能(gene function),疾病相关变异(disease-related vari 阅读全文

posted @ 2021-04-21 11:36 BioinformaticsMaster 阅读(4411) 评论(0) 推荐(0)

Fst计算
摘要:在群体遗传学中衡量群体间的遗传分化的程度的指标有许多种,较为常见的就是遗传分化指数(Fst),fst是由F统计量演变而来,F统计量主要有三种(FIS,FIF,FST)。Fst是针对一对等位基因,如果基因座上存在复等位基因,则需要用Gst衡量,基因差异分化系数(gene differentiation 阅读全文

posted @ 2021-04-09 17:53 BioinformaticsMaster 阅读(3818) 评论(1) 推荐(0)

LD Score regression文章 ;confounding
摘要:polygenicity多基因性(很多小的遗传效应)和混杂偏倚如隐秘的关联和群体分层都会导致GWAS 检验统计量test statistics的膨胀分布(inflated distribution)。我们开发了一种方法,即LD score regression,该方法通过检查 检验统计量(test 阅读全文

posted @ 2021-04-09 17:51 BioinformaticsMaster 阅读(1376) 评论(0) 推荐(0)

Random effects fixed meta-analysis
摘要:Meta-analysis 从相关研究中整合定量数据,并产生能够总结研究整体的结果。例如某些研究汇总risk ratio,然后统计生成summary estimate of the treatment effect。 Meta-analyses使用fixed effect或random effect 阅读全文

posted @ 2021-04-08 09:29 BioinformaticsMaster 阅读(711) 评论(0) 推荐(0)

群体遗传研究网站和github代码
摘要:基因组群体遗传变异影响研究 网站:https://github.com/macarthur-lab 【https://github.com/macarthur-lab 】研究内容包括gnomAD人群的深入研究,包括loss of function,罕见病等。github包含发表文章作图的代码等 ht 阅读全文

posted @ 2021-04-06 11:37 BioinformaticsMaster 阅读(100) 评论(0) 推荐(0)

孟德尔随机化 Mendelian randomization,MR
摘要:孟德尔随机化分析 Mendelian randomization,MR使用遗传变异作为工具变量,推断暴露因素与结局之间的因果关系,能有效克服混杂合反向因果问题所导致的偏倚。 1986年,Katan提出MR思想:由于配子形成时,遵循“亲代等位基因随机分配给子代”的孟德尔遗传规律,如果基因型决定表型,基 阅读全文

posted @ 2021-04-02 10:50 BioinformaticsMaster 阅读(6728) 评论(0) 推荐(0)

GWAS 画曼哈顿图,QQ plot,膨胀系数manhattan、Genomic Inflation Factor
摘要:转载自生信技能树 http://www.biotrainee.com/thread-496-1-1.html: 转载自陈文燕: https://mp.weixin.qq.com/s?__biz=Mzg2MDA2MDQzMQ==&mid=2247483759&idx=1&sn=4069ccf557f2 阅读全文

posted @ 2021-04-01 21:38 BioinformaticsMaster 阅读(582) 评论(0) 推荐(0)

GWAS 分析流程资料
摘要:1.特别全的陈文燕 GWAS全套流程https://mp.weixin.qq.com/s?__biz=Mzg2MDA2MDQzMQ==&mid=2247484897&idx=1&sn=9731b22d15b57873d198e054510675cb&chksm=ce2d6b81f95ae297965 阅读全文

posted @ 2021-04-01 21:26 BioinformaticsMaster 阅读(521) 评论(0) 推荐(0)

导航