trimmomatic软件进行重测序数据质控
001、 推荐使用如下参数
java -jar /path/trimmomatic-0.39.jar PE \
-phred33 \
-threads 16 \
sample_name_1.fq.gz sample_name_2.fq.gz \
-baseout /path/sample_name_trim.fastq.gz \
ILLUMINACLIP:/path/TruSeq3-PE.fa:2:30:10 \
LEADING:3 TRAILING:3 \
SLIDINGWINDOW:4:15 \
MINLEN:36
PE:指定双端测序
-phred33 : 设置碱基的质量格式,这里也可以不设定(v0.32版本之后可自动识别是phred33还是phred64,这个参数可以不用写啦,见图1截图自官方说明文档;)
-threads 16:指定线程数目
-baseout:指定质控输出的目录
ILLUMINACLIP: TruSeq3-PE.fa 指定接头序列 ## 主流使用TruSeq3-PE.fa,也有使用TruSeq3-PE-2.fa的,不知道区别在哪里?
2:30:10意义:seed mimatches 种子错配数:palindrome clipthreshold 双端剪切阈值:simple clip threshold单端剪切阈值:
LEADING:3:表示切除首端质量值低于20的碱基
TRAILING:3:表示切除尾端质量值低于20的碱基
SLIDINGWINDOW:4:15:表示从5'端开始,当4个碱基的窗口中的平均碱基质量值低于15时进行切除
MINLEN:36:指定最小碱基的长度。
。
图1: 0.32版本时候可以自动识别碱基质量T恤
。