随笔分类 -  基因组学

摘要:目录BSA的发展BSA分析框架BSA流程及影响因素BSA的群体BSA的算法BSA的软件BSA遗传群体、算法和软件的对应关系 BSA作为基因组学中基因挖掘的三板斧之一,最大优点是高效、经济、简便。通过选择双亲群体分离后代中具有极端表型的个体进行混样,然后比较不同极端混样池之间的多态性并结合表型进行目标 阅读全文
posted @ 2023-09-17 17:25 生物信息与育种 阅读(982) 评论(0) 推荐(0)
摘要:目录结构变异SV基于单个参考基因组鉴定SV通过构建泛基因组来鉴定SV转座元件与作物改良的相关性利用pan-genome进行QTL定位和GWAS利用pan-genome进行基因组预测泛基因组应用育种的挑战与机遇多倍体基因组的复杂性研究不足的作物基因组资源快速驯化新物种 结构变异SV 基于单个参考基因组 阅读全文
posted @ 2023-09-10 22:10 生物信息与育种 阅读(166) 评论(0) 推荐(0)
摘要:[toc] ## 需求描述 vcf是标准的基因型格式文件,其中包含的信息可多可少。主要在于INFO可无限扩展特征,以及每个样本的FORMAT信息,会大大增加vcf文件的大小。一般来说,GATK等软件得到的基因型都会有这些信息,初始变异我们最好保留它们,因为这是过滤位点/样本的依据。但是当我们确定了最 阅读全文
posted @ 2023-07-26 11:33 生物信息与育种 阅读(560) 评论(0) 推荐(0)
摘要:原始帖 Admixture做群体结构分析是好用,但也有一些不顺手的地方。最大的问题是不支持非整数的染色体号! 相信我们手里绝大部分vcf或plink格式文件,染色体ID基本是文本类型的吧。注意plink处理时加上-allow-extra-chr,若染色体数超过人类,可使用--chr-set设置。 s 阅读全文
posted @ 2023-03-14 17:09 生物信息与育种 阅读(846) 评论(0) 推荐(0)
摘要:不同基因组版本的位置(坐标)对应关系,在数据分析环节经常用到。 位置对应关系通常通过比对来获取,而信息一般存储在chain文件中。 对于人类、小鼠等模式生物而言,UCSC已经提供了不同版本的chain文件。 对于非模式生物,往往需要先自己制作chian文件,再通过ncbi的remap,UCSC的li 阅读全文
posted @ 2022-09-17 20:29 生物信息与育种 阅读(586) 评论(0) 推荐(0)
摘要:GMOD(Generic Model Organism Database) 是专为生物学家创建的开源项目,生物学家用作存储库和工具的交互应用程序和数据库的集合。 连通性是GMOD的关键。生物信息学应用程序和数据库大量产生,但其中许多工具很少使用,因为用户可能缺乏将工具连接到他们数据所需的资源或专业知 阅读全文
posted @ 2022-09-03 10:49 生物信息与育种 阅读(225) 评论(0) 推荐(0)
摘要:变异、基因表达和表型三者之间的关系很复杂,近期研究相关,头都想破了。然而很早以前就有人研究并总结过了。这里贴一个2015年发表NG上的TWAS综述,备忘。 TWAS研究路线: SNP、基因表达和表型三者之间的关系类型划分: Gusev A et al., Integrative approaches 阅读全文
posted @ 2022-05-29 23:35 生物信息与育种 阅读(362) 评论(0) 推荐(0)
摘要:BQSR vs. VQSR BQSR (Base Quality Score Recalibration)表示碱基质量值重校正。简言之,这是一个检测系统性错误的数据预处理步骤,用于检查测序仪估计每个碱基检测的准确性。 主要考虑了碱基在reads中的位置、上下文环境和原始质量值这三个因素,首先计算出原 阅读全文
posted @ 2022-05-24 21:29 生物信息与育种 阅读(1376) 评论(0) 推荐(0)
摘要:长读长组装发展 2012:三代组装、二代校正;耗资源,适合小基因组,如细菌,4-15%错误率 2013:三代组装、三代校正;仍然只适用小的 2014:华夏一号(中国人三代参考基因组) 2016:Falcon/Falcon-Unzip,三代Pacbio二倍体真核生物 2017:ONT UItralon 阅读全文
posted @ 2022-04-30 22:18 生物信息与育种 阅读(755) 评论(0) 推荐(1)
摘要:![](https://img2022.cnblogs.com/blog/1412292/202204/1412292-20220429154240952-276132857.png) 阅读全文
posted @ 2022-04-29 15:43 生物信息与育种 阅读(485) 评论(0) 推荐(0)
摘要:软件的安装 Python版McScan(jcvi工具包):https://github.com/tanghaibao/jcvi 以前只有python2,现在已有python3版本,建议用py3。安装可用pip: pip install jcvi ##或开发版 pip install git+git: 阅读全文
posted @ 2021-10-23 21:34 生物信息与育种 阅读(3811) 评论(0) 推荐(0)
摘要:1. ncRNA 非编码RNA(Non-coding RNA, ncRNA) 包括rRNA,tRNA,snRNA,snoRNA 和microRNA 等不编码蛋白质的RNA,它们转录后直接在RNA 水平上就能行使各自的生物学功能,并不需要翻译成蛋白质。 2. 软件 tRNA注释 一般用tRNAscan 阅读全文
posted @ 2021-10-11 12:11 生物信息与育种 阅读(3357) 评论(1) 推荐(1)
摘要:备注:本文主要来源于知乎《全新的泛基因组解决方案》。关于大豆泛基因组文章解读,请看往期记录《大豆(Soybean, Glycine max)泛基因组2020Cell》。 一、研究内容 泛基因组产品采用从头组装的策略进行泛基因组构建,分析内容包括比较基因组分析、核心基因和非必需基因分析、结构变异(SV 阅读全文
posted @ 2021-07-22 23:30 生物信息与育种 阅读(3563) 评论(0) 推荐(0)
摘要:问题 原问题来自:How to calculate overlapping genes between two genome annotation versions? 其实可分为两个问题: 一是我组装了一个新的基因组,做了多个注释版本,如何比较它们的feature?比如gene 二是我组装了一个新的 阅读全文
posted @ 2021-05-28 18:55 生物信息与育种 阅读(719) 评论(0) 推荐(0)
摘要:基因组长度 利用seqkit统计长度 seqkit stat test.fa 结果如下: file format type num_seqs sum_len min_len avg_len max_len test.fa FASTA DNA 149 396,098,845 10,246 2,658, 阅读全文
posted @ 2021-05-28 14:13 生物信息与育种 阅读(4046) 评论(0) 推荐(0)
摘要:记录下braker2的使用要点,以备忘记。 流程使用 braker2有很多流程,根据你的数据:组装的基因组、转录组、蛋白(同源,包括近缘或远缘)选择不同流程,官网有说明: https://github.com/Gaius-Augustus/BRAKER 现在的动植物组装,大多数都含有以上三类数据吧, 阅读全文
posted @ 2021-05-24 21:28 生物信息与育种 阅读(2754) 评论(1) 推荐(0)
摘要:在GWAS分析的结果中,偶尔会遇到到pvalue为0的SNP位点,这时如果直接做曼哈顿或QQ图,会出错,因为log0无意义。 此时,该如何处理? 如果你用的是Plink1.9来做的GWAS,可加一个参数: --output-min-p 1e-99,即将小于1e-99的pvalue都当成1e-99,0 阅读全文
posted @ 2021-05-04 21:43 生物信息与育种 阅读(2061) 评论(0) 推荐(0)
摘要:基因结构预测中同源注释策略,将mRNA、cDNA、蛋白、EST等序列比对到组装的基因组中,在文章中通常使用以下比对软件: tblastn gamp exonerate blat 根据我的实测,以上软件整体都比较慢。gmap可设置多线程来提升速度。tblastn虽然也可以,但对提速没什么影响。exon 阅读全文
posted @ 2021-04-16 12:11 生物信息与育种 阅读(3588) 评论(0) 推荐(0)
摘要:homology策略预测基因结构,下载了公共mRNA/CDS序列,考虑用gmap比对。本来是个很简单的脚本,但总是不那么顺利。 无论是用conda安装,还是源码安装较新版本,都存在问题。 gmap_build -D ./ -d reference reference.fa gmap -t 10 -D 阅读全文
posted @ 2021-04-15 22:43 生物信息与育种 阅读(1902) 评论(0) 推荐(0)
摘要:1.conda安装 conda安装虽然简单,但还是有很多坑,而且很多都是隐形的坑。 # conda install -c bioconda repeatmasker conda install -c bioconda repeatmodeler repeatmodeler依赖于repeatmaske 阅读全文
posted @ 2021-04-06 22:59 生物信息与育种 阅读(8958) 评论(2) 推荐(1)