安装并使用SnpEff注释

SnpEff is a variant annotation and effect prediction tool. It annotates and predicts the effects of genetic variants (such as amino acid changes).

一、安装

# Go to home dir
cd

# Download latest version
wget https://snpeff.blob.core.windows.net/versions/snpEff_latest_core.zip

# Unzip file
unzip snpEff_latest_core.zip

二、测试

#进入到snpEff目录下测试能否正常使用,日后在此目录下使用相关程序
cd /home/liuxin/snpEff

#查询数据库,并列出musculus相关的行或链接,正常显示则安装成功
java -jar snpEff.jar databases | grep -i musculus

三、配置

#配置文件
vim snpEff.config

任意行插入如下新物种信息如下

# Lychee genome
Lychee.genome : feizixiao

创建对应的data文件夹存储基因组文件

#此处的Lychee文件名与前处添加的相对应
mkdir -p ~/snpEff/data/Lychee

#进入目录下
cd ~/snpEff/data/Lychee

在Lychee文件夹下面,获取建库所需文件的两个文件

#参考基因组序列
sequences.fa.gz

#gff3注释文件
genes.gff.gz

四、建库

使用build命令建库

java -jar snpEff.jar build -gff3 -v Lychee

五、注释

 以vcf文件作为输入调用自建库Lychee开始注释获取注释后的snpeff.vcf

#input.vcf.gz作为输入VCF文件
java -jar snpEff.jar ann Lychee input.vcf.gz > snpeff.vcf

若只关注CDS中的注释信息,不考虑上游、下游、UTR、基因间区等信息,可使用如下参数简化输出集

java -jar snpEff.jar ann Lychee \
-no-utr -no-downstream -no-upstream -no-intergenic \
input.vcf.gz > snpeff.vcf

PS:若数据库中有参考也可以直接下载,无须建库。

PS:建库过程参考图(配置config文件建议准备好内容然后粘贴插入)


参考自:

SnpEff官网

Lychee测试数据来源

Build Database 相关具体内容

使用snpEff对VCF进行注释

SNPEFF snp注释 (添加自己基因组)

snpEff 对snp进行功能注释

 

posted @ 2022-08-23 16:58  pd_liu  阅读(1369)  评论(0)    收藏  举报