sratoolkit安装及使用
SRAtoolkit是ncbi的一个较方便的sra处理工具,用于SRA数据管理。其中fastq-dump可用于处理SRA数据类型,从SRA提取PE/SE序列;prefetch可实现批量从ncbi下载数据。除此之外,其实TBtools工具批量下载也非常方便,但需要额外的一步:将数据从电脑传至服务器。因此,还是SRAtoolkit相对而言更方便。
一、安装
wget --output-document sratoolkit.tar.gz https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/current/sratoolkit.current-ubuntu64.tar.gz
tar -vxzf sratoolkit.tar.gz
echo "export PATH=$PATH:/home/liuxin/sratoolkit/bin" >> ~/.bashrc
source ~/.bashrc
cd sratoolkit
vdb-config --interactive
#出现一个窗口,按下x退出配置完成
二、使用
#下载单条序列
prefetch SRR6185627
#批量下载序列,从ncbi批量选择序列,导出SRR_ACC_List.txt上传至服务器
prefetch --option-file SRR_ACC_List.txt
#SRA数据解压,--split-3参数适用于PE/SE压缩的SRA数据
for i in *sra
do
echo $i
/home/liuxin/sratoolkit/fastq-dump --split-3 $i
done
浙公网安备 33010602011771号