文章分类 - 生信知识
摘要:由于HiFi测序的CCS特性,公司交付的文件一般是bam文件,需要手动转换为fasta格式,以便后续组装。 PS:应该可以使用bamtools,进行相关的数据过滤,再转为fasta格式。 一、bam-->fasta sudo samtools view *.bam | awk '{print ">"
阅读全文
摘要:网上的很多教程说的共线性分析,往往是指的基因的共线性分布情况,具体作图时依据基因的关联位置信息等,输入文件包括gff以及fasta等信息。 这里说的亚基因组共线性,是指两条序列或两个基因组间的一致性分布情况,只需要输入两条fasta或者两个基因组序列文件即可,主要目的是看序列间的相似性以及发现序列间
阅读全文
摘要:awk '{if(NR%4 == 1){print ">" substr($0, 2)}}{if(NR%4 == 2){print}}' fastq > fasta
阅读全文
摘要:更多VCF格式详细信息参见http://samtools.github.io/hts-specs/VCFv4.2.pdf ##为header line,注释信息 #为data line,表头信息: CHROM - chromosome POS - position ID - identifier R
阅读全文
摘要:参考《Bioinfomatics Data Skill》第414页 一、首先安装pysam $ pip install pysam 二、编写程序统计比对数据 以下代码具有一定参考价值,不如samtools stats直接好用。若是需要单独统计特殊信息,以下代码逻辑/框架具有一定参考价值。 impor
阅读全文
浙公网安备 33010602011771号