Assemblytics鉴定基因组间SV

Assemblytics, 发表在Bioinformaticshttp://www.ncbi.nlm.nih.gov/pubmed/27318204,鉴定基因组间SV。

Githup,https://github.com/marianattestad/assemblytics

同时也可以在线使用,http://assemblytics.com

Assemblytics 首先基于nucmer比对 ($\color{red}{contigs 比对到ref genome}$),然后进行过滤,获取单一比对结果,进而进行SV的检测,可检测如下SV。

其中

  • 插入和缺失, <50 bp overlap or gap
  • Tandem, overmap >50 bp

依赖的工具
R相关

  • ggplot2
  • plyr
  • RColorBrewer
    -scales

Python

  • argparse
  • numpy

从githup下载后,给权限即可运行

chmod a+x scripts/Assemblytics*

第一步 序列比对

nucmer -maxmatch -l 100 -c 500 REFERENCE.fa ASSEMBLY.fa -prefix OUT

第二步 过滤并鉴定SV

scripts/Assemblytics <delta_file> <output_prefix> <unique_anchor_length> <min_variant_size> <max_variant_size>

或者直接使用在线工具也是可以的,将比对好的结果拽入红色框中即可

主要结果

  • 变异类型即数量分布图

  • 变异结果bed文件

reference	ref_start	ref_stop	ID	size	strand	type	ref_gap_size	query_gap_size	query_coordinates	method
NC_000913.3	1972855	1978502	Assemblytics_b_1	5647	+	Deletion	5647	0	NZ_CP009685.1:1721649-1721649:+	between_alignments
NC_000913.3	1873031	1873039	Assemblytics_b_2	777	+	Insertion	-8	769	NZ_CP009685.1:1821473-1822242:+	between_alignments
NC_000913.3	1096961	1097583	Assemblytics_b_3	181	+	Tandem_expansion	-622	-441	NZ_CP009685.1:2597877-2598318:-	between_alignments
NC_000913.3	4295948	4296271	Assemblytics_b_5	113	+	Tandem_contraction	-323	-436	NZ_CP009685.1:4040722-4041158:-	between_alignments

欢迎扫码交流

posted @ 2021-01-25 13:11  斩毛毛  阅读(600)  评论(0编辑  收藏  举报