摘要: 1.Seqkit提取 seqkit作为一个非常全能的软件,之前有多次利用到,本来早就该学习了,却一直拖欠了下来。这次要进行一个cds序列的提取,所以在此做一个记录。 目标:将含有多个转录本的Pep文件提取出只有t1序列。 提取现在文件的id序列表 seqkit seq pep.fa -n -i -o 阅读全文
posted @ 2025-01-20 22:29 饭团ft 阅读(204) 评论(0) 推荐(0)
摘要: 转录本:由一条基因通过转录,由于可变剪切形成的一种或多种可供编码蛋白质的成熟mRNA。另外非编码RNA也可能有转录本的说法。 最长转录本:可变剪切一个基因得到多个序列长度不同的转录本,应选序列最长的进行数据分析。 CDS:蛋白质编码区,是与蛋白序列一一对应的DNA序列,不存在内含子。 提取物种所有的 阅读全文
posted @ 2025-01-20 22:27 饭团ft 阅读(414) 评论(0) 推荐(0)
摘要: 将测序后的reads与组装好的基因组做alignment(校准),这个过程就被叫做mapping。Mapping之后生成的SAM/BAM文件,可以获取reads mapping回参考基因组的信息(比如mapping rate,coverage,depth),从而评估基因组组装的质量。 1.Mappi 阅读全文
posted @ 2024-10-17 21:02 饭团ft 阅读(928) 评论(0) 推荐(0)
摘要: SRA数据库: Sequence Read Archive:隶属NCBl (National Center for Biotechnology Information)它是一个保存大规模平行测序原始数据以及比对信息和元数据(metadata)的数据库,所有已发表的了献中高通量测序数据基本都上传至此, 阅读全文
posted @ 2024-10-14 13:48 饭团ft 阅读(600) 评论(0) 推荐(0)
摘要: Tmux是会话(session)与终端窗口(terminal window)的解绑工具,可以同时运行多个命令,可以让新窗口"接入"已经存在的会话允许每个会话有多个连接窗口,因此可以多人实时共享会话,支持窗口任意的垂直和水平拆分。 创建一个名字为ft的新窗口 tmux new -s ft 重新进入名字 阅读全文
posted @ 2024-09-19 17:32 饭团ft 阅读(71) 评论(0) 推荐(0)