antiSMASH数据库:微生物次生代谢物合成基因组簇查询和预测

2017年4月28日,核酸研究(Nucleic Acids Research)杂志上,在线公布了一个可搜索微生物次生代谢物合成基因组簇的综合性数据库antiSMASH数据库 4.0版,前3版年均引用250次,累计引物1600+;可实现基因组与基因组之间的相关天然产物合成基因簇的查询和预测。
 
临床上使用的大部分抗生素和药物均来自植物或微生物的天然产物。结合基因组挖掘的经典分离与分析法使得能鉴定和描述基于宏基因组的天然产物途径,该过程与研究结果是天然产物研究领域中在近二十年来较为创新的技术。为使该技术能为更为广泛的研究者使用,许多精确的软件被建立。antiSMASH自2010年开放以来,在次生代谢物基因组挖掘上带来了重要的影响。然而,antiSMASH只能分析一个(单独的)基因组来进行基因组挖掘,它不能提供基因组之间的交叉或相互连接的功能关系。因此,研究者在文章中建立了antiSMASH数据库,该数据库包含了所有NCBI GenBank数据库上公布了(截止至2016年5月27日)的可用的细菌基因组信息(3907生物物种的8883条信息)。
 
antiSMASH数据库能为研究者提供一个使用方便、注释了的生物合成基因簇最新集合,可以让研究者在提供复杂的问题之后轻松地进行基因组之间的分析。作者在文章中提供了antiSMASH的相关网站信息,并在实例中以链霉菌中核糖体合成并进行转录后翻译且不是lantipeptides的基因簇进行搜索,为读者提供了直观的介绍。
 
# 官方主页
http://antismash.secondarymetabolites.org/
# 直接分析NCBI的基因组编号 
1. 访问NCBI主页 https://www.ncbi.nlm.nih.gov/
2. 检查某细菌:类型选择“Genome”,检索根癌农杆菌 “ Agrobacterium tumefaciens LBA4213 ”,可以找到唯一结果会自己打开,页面为 https://www.ncbi.nlm.nih.gov/genome/?term=Agrobacterium+tumefaciens+LBA4213
3. 找ID:页面中没有基因组序列的ID,点击genome链接会下载该基因组,右键复制链接中包括其ID,如此链接为ftp://ftp.ncbi.nlm.nih.gov/genomes/all/GCF/000/576/515/GCF_000576515.1_ASM57651v1/GCF_000576515.1_ASM57651v1_genomic.fna.gz, 其中的” CF_000576515.1 “即为NCBI ID
4. 在Antismach主页中找NCBI acc #处,填写NCBI ID,点Submit提交即开始运行
 
上传某个新细菌基因组
访问 http://www.at-sphere.com/,这里有几百个新测序的细菌基因组;
点击左侧 assemblies 链接,会出现细菌列表;
我们下载Leaf1
解压后为.fna的fasta文件
AntiSmach页面选择Upload file
直接选择上传文件,并submit即可
 
全基因组注释,运行时间会很久,任务也可能排除,需要等很久。也可以自己安装软件的本地版,在本地计算结果
 
结果说明
上图为我分析的AT-Sphere中根际Root107编号菌基因组的结果
1. Select Gene Cluster为找到的基因簇的列表,共有93个,其中高亮的有次级代谢产物相关,灰度一般为基础代谢物,如糖、脂等; 
2. Identified 下面为详细的列表; 
3. 点击上方簇编号可看到每个簇的详细结构和基因注释; 
有基因结果图,每个基因注释,可以鼠标悬停显示,下面还有相近的细菌基因结构
posted @ 2017-08-01 21:46  弗雷赛斯  阅读(3421)  评论(0编辑  收藏  举报