linux 中 trimmomatic软件的安装及使用
001、下载
官网:http://www.usadellab.org/cms/?page=trimmomatic
下载0.39版本:

002、上传至linux 中,然后解压
[root@pc1 software]# ls ## 列出安装包 Trimmomatic-0.39.zip [root@pc1 software]# unzip Trimmomatic-0.39.zip ## 解压 Archive: Trimmomatic-0.39.zip creating: Trimmomatic-0.39/ inflating: Trimmomatic-0.39/LICENSE inflating: Trimmomatic-0.39/trimmomatic-0.39.jar creating: Trimmomatic-0.39/adapters/ inflating: Trimmomatic-0.39/adapters/NexteraPE-PE.fa inflating: Trimmomatic-0.39/adapters/TruSeq2-PE.fa inflating: Trimmomatic-0.39/adapters/TruSeq2-SE.fa inflating: Trimmomatic-0.39/adapters/TruSeq3-PE-2.fa inflating: Trimmomatic-0.39/adapters/TruSeq3-PE.fa inflating: Trimmomatic-0.39/adapters/TruSeq3-SE.fa [root@pc1 software]# cd Trimmomatic-0.39/ ## 进入解压目录 [root@pc1 Trimmomatic-0.39]# ls ## 可执行java程序 adapters LICENSE trimmomatic-0.39.jar

003、使用方法,trimmomatic软件的使用需要java环境
java -jar trimmomatic-0.39.jar PE -threads 4 test_1.fastq.gz test_2.fastq.gz -baseout test_trim.fastq.gz ILLUMINACLIP:TruSeq3-PE.fa:2:30:10:1 LEADING:20 TRAILING:20 SLIDINGWINDOW:4:15 MINLEN:50
01、trimmomatic-0.39.jar:主程序
02、PE:表示双端测序
03、-threads 4: 指定线程数
04、test_1.fastq.gz test_2.fastq.gz:测试fastq文件
05、-baseout: 指定输出文件
06、ILLUMINACLIP:TruSeq3-PE.fa:指定接头序列
07、2:30:10:1: 2表示最大的mismatch数目; 30表示palindrone模式下碱基的匹配阈值;10表示simple模式下碱基的匹配阈值;1表示
palindrone模式允许切除的最短接头序列为1bp(模式为8bp)
08、LEADING:20 表示切除read 5'端碱基质量低于20的碱基
09、TRAILING:20 表示切除read 3'端碱基质量低于20的碱基
010、SLIDINGWINDOW:4:15 表示以4个碱基为窗口进行滑动,切除窗口内碱基平均质量小于15的
011、MINLEN:50: 丢弃以上步骤处理后序列长度小于50的reads
012、-phred33: 指定fastq的质量值编码格式,如果不设置这个参数,软件会自动判断输入文件是哪种格式(v0.32之后的版本);如果不确定,可以不设置这参数;
004、结果文件
结果文件一共输出4个文件;
test_paired_r1.clean.fastq.gz
test_unpaired_r1.clean.fastq.gz
test_paired_r2.clean.fastq.gz
test_unpaired_r2.clean.fastq.gz
其中 test_paired_r1.clean.fastq.gz 和 test_paired_r2.clean.fastq.gz 为质控后剩余的成对的reads;
test_unpaired_r1.clean.fastq.gz 为 read1中剩余的单个read;
test_unpaired_r2.clean.fastq.gz 为 read2中剩余的单个read;

浙公网安备 33010602011771号