blast -m1
摘要:当database是10个物种(A、B、C、E、F、G、H、J、I、K)时,进行all vs all 比对结果是: 此时reference是物种A的第一个基因:即用10个物种的genome中的所有基因比对物种A的基因1 eg:如下 1.Sequences producing significant
阅读全文
workflow
摘要:step1:grep data step2:build index Picard CreateSequenceDictionary creates .dict file and samtools faidx creates a .fai file. Both are needed for GATK
阅读全文
Sam format
摘要:reference:https://davetang.org/wiki/tiki-index.php?page=SAM @SQ SN:contig1 LN:9401 (序列ID及长度) 参考序列名,这些参考序列决定了比对结果sort的顺序,SN是参考序列名;LN是参考序列长度;每个参考序列为一行。
阅读全文
samtools faidx
摘要:第一列 NAME : 序列的名称,只保留“>”后,第一个空白之前的内容; 第二列 LENGTH: 序列的长度, 单位为bp; 第三列 OFFSET : 第一个碱基的偏移量, 从0开始计数,换行符也统计进行;gff文件中的mRNA start那一列的值 第四列 LINEBASES : 除了最后一行外,
阅读全文
bwa index|amb|ann|bwt|pac|sa
摘要:其中: 参数-a用于指定建立索引的算法: bwtsw 适用于>10M is 适用于参考序列<2G (默认-a is) 可以不指定-a参数,bwa index会根据基因组大小来自动选择合适的索引方法 .amb is text file, to record appearance of N (or ot
阅读全文