NECAT组装ONT long reads

NECAT 可用于ONT数据的纠错,组装,如果想对ONT long reads进行call SV,也可以使用necatsv.

githup网址:https://github.com/xiaochuanle/NECAT/blob/master/README.md

安装

两种方法:

  • 第一种方法
 wget https://github.com/xiaochuanle/NECAT/releases/download/v0.0.1_update20200803/necat_20200803_Linux-amd64.tar.gz
 tar xzvf necat_20200803_Linux-amd64.tar.gz
 cd NECAT/Linux-amd64/bin
 export PATH=$PATH:$(pwd)
  • 第二种方法
 git clone https://github.com/xiaochuanle/NECAT.git
 cd NECAT/src/
 make
 cd ../Linux-amd64/bin
 export PATH=$PATH:$(pwd)

最后加入环境变量即可

简单使用

  • Step 1 配置文件

necat.pl config config.txt

会得到一个config.txt的配置文件,并对其进行配置,比如

PROJECT=17s1XX
ONT_READ_LIST=read_list.txt
GENOME_SIZE=1000000000
THREADS=4
MIN_READ_LENGTH=3000

起他可以默认即可
read_list.txt 为long reads的绝对路径

  • Step 2 correct raw reads

necat.pl correct ecoli_config.txt

只对40X(PREP_OUTPUT_COVERAGE)的reads进行纠错,Corrected reads路径位于./17s1XX/1-consensus/cns_iter${NUM_ITER}/cns.fasta.

  • Step 3 组装

necat.pl assemble ecoli_config.txt

针对纠错后的reads进行组装,如果么有纠错,则自动进行纠错步骤.
运行结果位于./17s1XX/4-fsa/contigs.fasta.

  • Step 4 Bridge contigs

necat.pl bridge ecoli_config.txt

结果位于:./17s1XX/6-bridge_contigs/bridged_contigs.fasta.

如果设置了POLISH_CONTIGS,则会利用纠错后的reads 对bridged contigs进行polish。
结果位于:6-bridge_contigs/polished_contigs.fasta

多节点计算

如果使用的是PBS或者SGE系统,可以设置配置文件中的如下参数进行多节点运行

USE_GRID=true
GRID_NODE=4

欢迎扫码交流

posted @ 2021-01-22 14:53  斩毛毛  阅读(497)  评论(0编辑  收藏  举报