09 2022 档案

摘要:用得非常之多的一款组装软件。安装容易,使用简便,默认参数跑就完事。hifiasm 拼接快速,更好应对重复片段,产生组装集质量高。 基于Hi-C可以产生单倍型分辨率的组装集。 hifiasm组装后不需要polish,简化了组装流程,大大节省了时间。 一、安装 git clone https://git 阅读全文
posted @ 2022-09-27 23:18 pd_liu 阅读(1753) 评论(0) 推荐(0)
摘要:Quickmerge可以用于合并两个不同软件组装产生的Assemblies,以获取更可靠的组装结果。quickmerge 一、安装 git clone https://github.com/mahulchak/quickmerge.git cd quickmerge bash make_merger 阅读全文
posted @ 2022-09-27 22:48 pd_liu 阅读(993) 评论(0) 推荐(0)
摘要:拼接部分采用默认参数。适用于ONT组装,对于PacBio数据有更优的软件处理,此处不讨论。 总的来说,拿到ONT的数据后,建议先尝试miniasm快速拼接看一下拼接情况,再决定使用什么策略进行精细的组装。这里列出了六种可用于ONT组装的软件的相关用法,另外还有FALCON可以尝试,看文献近两年好像使 阅读全文
posted @ 2022-09-27 21:49 pd_liu 阅读(1395) 评论(0) 推荐(0)
摘要:Graph-based从头拼接软件,和canu一样可以先correct然后再组装。但nextdenovo一般用于ont组装。结合nextpolish可以获取碱基准确度达985以上。 配置好组装序列文件路径以及配置文件,直接运行即可,使用简单。 Github官网 Tutorial 配置run.cfg说 阅读全文
posted @ 2022-09-27 18:27 pd_liu 阅读(1639) 评论(0) 推荐(1)
摘要:官网:miniasm 类似于flye的轻量级组装软件,使用和flye一样极其简单。 基于OLC的超快速从头拼接软件,适用于noisy长reads。但不纠错,并没有构建一致性序列的步骤,也就是说组装前后的单碱基错误率没有变化。 据官网描述,105m的基因组大小,只使用40x的数据集组装,16个线程10 阅读全文
posted @ 2022-09-26 22:09 pd_liu 阅读(601) 评论(0) 推荐(0)
摘要:官网:Winnowmap 无意间在一篇Human T2T的文章的补洞过程中发现的一款比对软件,据说准确度优于minimap2,特别是着丝粒区域。 之前用minimap2 -cx asm5模式比对两个亚基因组,最后用dotPlotly可视化后发现染色体上普遍存在一些集中区域比对效果并不好,可能是着丝粒 阅读全文
posted @ 2022-09-26 21:40 pd_liu 阅读(1531) 评论(1) 推荐(0)
摘要:官网地址:flye Flye works directly with base-called raw reads and does not require any prior error correction or trimming. Flye automatically detects chime 阅读全文
posted @ 2022-09-26 21:06 pd_liu 阅读(1248) 评论(0) 推荐(0)
摘要:本文尝试使用ragtag补洞。该软件一般用于基因组校正错配、scaffolding、patch以及序列合并。官网地址:https://github.com/malonge/RagTag/wiki/patch 一、安装 conda install -c bioconda ragtag 二、使用 #ma 阅读全文
posted @ 2022-09-26 18:22 pd_liu 阅读(834) 评论(0) 推荐(0)
摘要:网上的很多教程说的共线性分析,往往是指的基因的共线性分布情况,具体作图时依据基因的关联位置信息等,输入文件包括gff以及fasta等信息。 这里说的亚基因组共线性,是指两条序列或两个基因组间的一致性分布情况,只需要输入两条fasta或者两个基因组序列文件即可,主要目的是看序列间的相似性以及发现序列间 阅读全文
posted @ 2022-09-23 22:27 pd_liu 阅读(1009) 评论(0) 推荐(1)
摘要:一、前言 参考自官网流程:https://weatherby.genetics.utah.edu/MAKER/wiki/index.php/MAKER_Tutorial_for_WGS_Assembly_and_Annotation_Winter_School_2018#Example_MAKER_ 阅读全文
posted @ 2022-09-21 23:13 pd_liu 阅读(1815) 评论(1) 推荐(0)
摘要:awk '{if(NR%4 == 1){print ">" substr($0, 2)}}{if(NR%4 == 2){print}}' fastq > fasta 阅读全文
posted @ 2022-09-21 09:18 pd_liu 阅读(56) 评论(0) 推荐(0)
摘要:OrthoFinder,主要应用于基因家族分析。 使用OrthoFinder关注的基本生物学问题如下: Performing a comparative analysis across a clade of species Identifying orthologs between a pair, 阅读全文
posted @ 2022-09-19 20:11 pd_liu 阅读(2410) 评论(0) 推荐(0)
摘要:EDTA,该软件包用于全基因组TE的从头注释。EDTA设计目的是为全基因组生成一个高质量、无冗余的TE库,并过滤掉原始候选TE中的错误发现。EDTA官网 EDTA整合了多种TE注释软件,具体框架结构以及包含的软件如下: 一、安装 #途径一(mamba很好用,但是我这里安装总出错) conda cre 阅读全文
posted @ 2022-09-18 23:03 pd_liu 阅读(3205) 评论(0) 推荐(0)
摘要:#Minimap2 is a general-purpose alignment program to map DNA or long mRNA sequences against a large reference database. #使用minimap2进行长reads比对,对于~10kb的n 阅读全文
posted @ 2022-09-18 19:47 pd_liu 阅读(4770) 评论(0) 推荐(0)
摘要:SRAtoolkit是ncbi的一个较方便的sra处理工具,用于SRA数据管理。其中fastq-dump可用于处理SRA数据类型,从SRA提取PE/SE序列;prefetch可实现批量从ncbi下载数据。除此之外,其实TBtools工具批量下载也非常方便,但需要额外的一步:将数据从电脑传至服务器。因 阅读全文
posted @ 2022-09-17 22:58 pd_liu 阅读(1515) 评论(0) 推荐(0)
摘要:Trimmomatic,用于二代序列去接头,同时可以自定义指定的接头序列,同时也能够过滤read末尾的低质量序列,多线程运行,速度较快。 https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4103590/ 一、安装 conda install -c bioco 阅读全文
posted @ 2022-09-17 20:51 pd_liu 阅读(2116) 评论(0) 推荐(0)
摘要:fastqc是高通量序列(fa/fq)质量控制(QC)分析工具。它可以快速地对测序数据进行质量评估,得到多个测序数据的质量参数,让我们对测序数据质量有个初步的认识,从而判断后续的质控如何进行。 使用fastqc做质控 使用fastqc批处理 FastQC官网 一、安装 conda install - 阅读全文
posted @ 2022-09-16 23:04 pd_liu 阅读(3651) 评论(0) 推荐(0)
摘要:Nanopore测序下机原始数据为fast5格式(纳米孔原始的电信号文件),测序公司那边只进行了初步的质控,也就是生成了pass_fast5文件夹,其下包含上百条.fast5格式的数据。对于后续的数据分析非常的不方便。现需要将所有.fast5文件合并,并从合并后的fast5文件提取fasta序列。 阅读全文
posted @ 2022-09-16 20:41 pd_liu 阅读(794) 评论(0) 推荐(0)
摘要:fastp是一款快速处理NGS下机序列的工具,官网地址fastp 一、安装 conda install -c bioconda fastp 二、使用 #过滤接头以及低质量碱基相关参数默认开启 #输入双端序列文件支持SE/PE,可以是.fq/.fq.gz格式,fastp最多可用16个线程 #输出会同时 阅读全文
posted @ 2022-09-16 20:13 pd_liu 阅读(8043) 评论(0) 推荐(0)
摘要:manual vcftools documentation vcftools is a suite of functions for use on genetic variation data in the form of VCF and BCF files. The tools provided 阅读全文
posted @ 2022-09-14 11:10 pd_liu 阅读(1119) 评论(0) 推荐(0)
摘要:GATK pipeline 学习。本文结合gatk流程应用于检查GapFilling区域的正确性。 下载及安装细节参见GATK官网流程理解请参考https://www.jianshu.com/p/859c0345624c 一、WGS分析流程主要包括三个部分:原始数据质控、数据预处理以及变异检测。 二 阅读全文
posted @ 2022-09-12 23:35 pd_liu 阅读(1020) 评论(0) 推荐(0)
摘要:目的:实验室台式机重装系统WIN10。 1、U盘一个,容量大于8g 2、打开mac磁盘工具,格式化U盘成windows文件格式,选择ExFAT格式,重命名为WIN10 3、MSDN网站下载所需系统,下载完成后双击iso镜像完成本地挂载 4、打开mac终端输入如下命令获取U盘以及WIN10镜像的名称 阅读全文
posted @ 2022-09-12 20:39 pd_liu 阅读(8437) 评论(0) 推荐(0)
摘要:BWA is a software package for mapping DNA sequences against a large reference genome,such as the human genome. BWA官网 Manual Page 源码克隆地址 BWA安装比较简单,以下简单 阅读全文
posted @ 2022-09-10 22:30 pd_liu 阅读(1878) 评论(0) 推荐(0)
摘要:本文主要使用BBMerge合并双端序列为单端序列文件,便于后续处理。 BBTools官网 BBMerge手册 BBMerge是BBTools中的一个工具。 bbduk – filters or trims reads for adapters and contaminants using k-mer 阅读全文
posted @ 2022-09-10 21:33 pd_liu 阅读(689) 评论(0) 推荐(0)
摘要:MAKER是一个整合多个基因注释软件的强大pipeline。如果对基因组注释流程不熟悉,建议先补充相应的内容再开始使用MAKER。本文主要摘录自MAKER官网 #先创建一个maker环境并激活 conda create -n maker3 conda activate maker3 PS: 部分依赖 阅读全文
posted @ 2022-09-06 22:27 pd_liu 阅读(5868) 评论(0) 推荐(1)
摘要:Canu是组装PacBio以及Nanopore序列的组装软件。本文摘录自官网手册。 参考手册及官网地址 Quick-StartCanu-TutorialGiHub Description Canu specializes in assembling PacBio or Oxford Nanopore 阅读全文
posted @ 2022-09-05 23:11 pd_liu 阅读(2093) 评论(0) 推荐(0)
摘要:一、安装homebrew #官网地址如下,参照官网安装即可 Homebrew #将官网给出的命令拷贝至终端回车运行,输入密码,即可开始安装 /bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HE 阅读全文
posted @ 2022-09-03 00:11 pd_liu 阅读(5920) 评论(0) 推荐(0)