## 1、 基因ID转换工具 https://hum-molgen.org/NewsGen/08-2009/000020.html ## 2、 the known binding sites of all TFs R 包 MotifDb: https://github.com/PriceLab/Mo
这些年,陆陆续续收到不少小伙伴问我怎么在文章中致谢我,给个统一模板: We thank the blogger (orange_milk_sugar, Wenyan Chen) for XXX XXX 部分请自由发挥。
1. 人类基因组转录起始位点 TSS http://reftss.clst.riken.jp/datafiles/current/human/refTSS_v3.1_human_coordinate.hg38.bed.gz http://reftss.clst.riken.jp/datafiles/
时隔一年多,于今日(20210313)再次更新教程,后续如果新出教程的话会一直更新。 同时感谢多年陪伴我成长、一直默默关注我的**「你们」**~ by 「橙子牛奶糖(陈文燕)」 1.前言 很多人问我有没有关于全基因组关联分析(GWAS)原理的书籍或者文章推荐。 其实我个人觉得,做这个分析,先从跑流程
1、列表包括数据库名称、表型、是否能下载到基因型(genotype)、是否能下载到GWAS结果文件(P值、效应值、SNP位点)。目前收集到的有如下: 参考到这些数据库的文献:Genome-wide association study identifies 74 loci associated wit
原始的输入文件 file.wig 如下所示: 1 3110982 3111121 4 1 3115138 3115146 1 1 3115146 3115149 2 1 3115149 3115152 3 1 3115152 3115161 4 在 file.wig 文件中加上chr就可以解决报错了
举个例子,现有文件test: CGAGTA 我们想将test文件的第二个字符(即G)替换为C,生成test1文件: CCAGTA 即可使用如下代码: awk 'BEGIN{FS=OFS=""}{sub(/G/,"C",$2)}1' test > test1
FASTQ 转为 FASTA seqkit fq2fa gene.fastq -o gene.fa gene.fastq gene.fa
解决办法:去除在所有feature(比如基因)均为0到样本
CD4+ T: CD3D+, CD3E+, CD8A–; CD8+ T: CD3D+, CD8A+; NK cells: CD3D–, NKG7+, GNLY+; monocytes: CD14+, LYZ+; B: MS4A1+; granulocytes: PRSS57+; dendritic
The resulting CADD scores are expressed as a measure of deleteriousness (selection pressure bias) for single‐nucleotide variants (SNVs) and small inde
LOEUF (the loss-of-function observed/expected upper bound fraction): LOEUF is a conservative estimate of evolutionary selection against disease-causin
使用命令tabix tumor.bed.gz 报错了:tabix: [ti_index_core] the file out of order at line XXX 加上参数-p bed就好了:tabix -p bed tumor.bed.gz
之前教程提到过Metal是可以做Meta分析,除了Metal,PLINK也可以进行Meta分析。 命令如下所示: plink --meta-analysis gwas1.plink gwas2.plink gwas3.plink + logscale qt --meta-analysis-snp-f
95%CIs = mean (+ or -) 1.96 * SE SE(standard error of the mean) = SD / ( n^(1/2) )
