文章分类 -  生信知识

摘要:由于HiFi测序的CCS特性,公司交付的文件一般是bam文件,需要手动转换为fasta格式,以便后续组装。 PS:应该可以使用bamtools,进行相关的数据过滤,再转为fasta格式。 一、bam-->fasta sudo samtools view *.bam | awk '{print ">" 阅读全文
posted @ 2022-10-07 19:28 pd_liu 阅读(859) 评论(0) 推荐(0)
摘要:网上的很多教程说的共线性分析,往往是指的基因的共线性分布情况,具体作图时依据基因的关联位置信息等,输入文件包括gff以及fasta等信息。 这里说的亚基因组共线性,是指两条序列或两个基因组间的一致性分布情况,只需要输入两条fasta或者两个基因组序列文件即可,主要目的是看序列间的相似性以及发现序列间 阅读全文
posted @ 2022-09-23 22:27 pd_liu 阅读(952) 评论(0) 推荐(0)
摘要:awk '{if(NR%4 == 1){print ">" substr($0, 2)}}{if(NR%4 == 2){print}}' fastq > fasta 阅读全文
posted @ 2022-09-21 09:18 pd_liu 阅读(46) 评论(0) 推荐(0)
摘要:更多VCF格式详细信息参见http://samtools.github.io/hts-specs/VCFv4.2.pdf ##为header line,注释信息 #为data line,表头信息: CHROM - chromosome POS - position ID - identifier R 阅读全文
posted @ 2022-08-21 16:28 pd_liu 阅读(70) 评论(0) 推荐(0)
摘要:参考《Bioinfomatics Data Skill》第414页 一、首先安装pysam $ pip install pysam 二、编写程序统计比对数据 以下代码具有一定参考价值,不如samtools stats直接好用。若是需要单独统计特殊信息,以下代码逻辑/框架具有一定参考价值。 impor 阅读全文
posted @ 2022-08-20 17:36 pd_liu 阅读(429) 评论(0) 推荐(0)