随笔分类 -  基因组学

摘要:1. 主要纠错类型 上篇HiC挂载软件以及如何用Juice_box手工纠错?我吐槽了Juicebox操作麻烦,且没有详细文档。今天在3d-dna流程3D de novo assembly (3D-DNA) pipeline中,终于找到Juicebox的官方文档了:http://aidenlab.or 阅读全文
posted @ 2021-03-29 18:12 生物信息与育种 阅读(4842) 评论(0) 推荐(1)
摘要:1.常用HiC挂载软件 ALLHiC 张兴坦老师专为多倍体和高杂合度物种基因组挂载开发。如果是复杂基因组,肯定是首选。对于简单基因组,我跑了下,结果不佳。提了issue,张老师特意开发了个为简单基因组设计的流程:https://github.com/tangerzhang/ALLHiC/blob/m 阅读全文
posted @ 2021-03-28 23:18 生物信息与育种 阅读(5943) 评论(0) 推荐(0)
摘要:需求 客户随手丢来一个基因型文件,类似于hapmap格式,只是少了中间多余的那几列,像这种类hapmap格式文件,往往是芯片数据。 这样的数据因为缺乏等位基因:参考碱基和变异碱基信息,对应在vcf文件中就是REF和ALT,导致后续一些分析没法进行。 那么,问题来了:怎么根据这个基因型文件来推断参考和 阅读全文
posted @ 2021-03-25 22:26 生物信息与育种 阅读(579) 评论(0) 推荐(0)
摘要:下了一些sra数据库中的公共数据,因为pretech和aspera不稳定,稍微大点的文件经常传断,部分文件我只能通过本地下载再上传。 那么问题来了,sra没有md5校验,我怎么知道我数据的完整性,尤其是通过本地下载的那些数据? 网上查了下是说,sra是自带md5校验的(The SRA archive 阅读全文
posted @ 2021-03-05 11:15 生物信息与育种 阅读(2893) 评论(0) 推荐(0)
摘要:1. 什么是单倍型? 同源染色体:同源染色体,一个来自母本,一个来自于父本。 单倍型:单倍体基因型的简称。遗传学上指在单条染色体上一系列遗传变异位点的组合。 2. 单倍型组装的意义? 目前,大多数二倍体基因组组装都忽略了同源染色体之间的差异,将基因组组装成一个假的单倍体序列,这是二倍体类型的组装的人 阅读全文
posted @ 2021-02-08 17:28 生物信息与育种 阅读(2506) 评论(0) 推荐(0)
摘要:前言 王向峰老师2020年发表在《Genomics Proteomics Bioinformatics》(IF=6.597)上的文章。对于做数据分析的人来说,如何挖掘公共数据,如何从海量SNP中挖掘目标SNP等问题都是每天要面对的,这篇文章给了一个参考,很值得学习。 文章从水稻变异数据库RVD的子库 阅读全文
posted @ 2021-02-06 17:12 生物信息与育种 阅读(1393) 评论(0) 推荐(0)
摘要:前言 植物基因组大小跨越几个数量级,倍性和杂合性变化,以及新旧基因组转座子变化等带来组装挑战。三代和物理图谱提供了新机会,单倍型定相、结构变异分析、从头泛基因组研究成为新兴组装热点。 植物基因组发展: 拟南芥:sanger BAC-by-BAC。 shotgun OLC (CELERA assemb 阅读全文
posted @ 2021-02-02 20:08 生物信息与育种 阅读(848) 评论(0) 推荐(0)
摘要:1. 建立项目团体 多机构合作,数据和利益共享。 2. 收集目标基因组信息 考虑的因素: 基因组大小、倍性、杂合性、GC含量和重复。 数据库查询: fungi (http://www.zbi.ee/fungalgenomesize) animals (http://www.genomesize.co 阅读全文
posted @ 2021-02-01 22:35 生物信息与育种 阅读(1232) 评论(0) 推荐(1)
摘要:单倍型,即单倍体基因型,概念很好理解。 单倍型分型的过程就称之Phasing,定相或基因分型。 Phasing的意义,在人类疾病遗传和动植物群体遗传中非常重要。也是imputation的必经过程。 vcf文件中,./.和.|.分别表示未定相和已定相。 Phasing的方法: 家系定相,最准确,一般根 阅读全文
posted @ 2021-01-14 15:24 生物信息与育种 阅读(2396) 评论(0) 推荐(0)
摘要:组装策略 二代测序平台如Illumina、BGI,稳定可靠,数据质量高,成本低,读长短。 三代测序平台如PacBio、Nanopore,超长读长、无PCR扩增,错误率高,成本高。 现在物种的简单基因组基本已完成大多,纯二代组装已经没什么意义,复杂基因组或者高质量基因组基本都是三代测序为主。 由于经费 阅读全文
posted @ 2021-01-13 11:55 生物信息与育种 阅读(1302) 评论(0) 推荐(0)
摘要:我们最常用最熟悉的功能数据库之一:GO(gene onotology),基因本体论。其实是一套标准词汇术语,目的是从不同角度来描述某个基因的特点和功能,三大本体如生物学进程(BP)、分子功能(MF)和细胞组分(CC)。 看文献的时候,偶然看到了TO(trait onotology)和CO(crop 阅读全文
posted @ 2020-12-18 14:39 生物信息与育种 阅读(767) 评论(0) 推荐(0)
摘要:说明 Admixture通过EM算法一般用于指定亚群分类;或者在不知材料群体结构背景下,通过迭代交叉验证获得error值,取最小error对应的K值为推荐亚群数目。如果我们预先已知群体的类型(百分百确信),那么可以考虑监督分类方法,设置标签,提高分群的准确性。 Admixture目前是1.3.0,文 阅读全文
posted @ 2020-12-17 12:35 生物信息与育种 阅读(1238) 评论(0) 推荐(0)
摘要:最近看了不少统计基因组方面的资料,以为懂了,其实懵逼。实在是因为统计学基础太菜,似懂非懂,似是而非。记录下自己的理解,求轻喷。 1.GWAS模型 GWAS是表型和基因型之间的相关性分析,然而这个相关性用什么统计方法? GWAS模型的发展: 1.1卡方检验 实际比例是否符合预期分离比例,若不符合则认为 阅读全文
posted @ 2020-12-16 22:01 生物信息与育种 阅读(4365) 评论(0) 推荐(0)
摘要:参考: 视频PPT来自欧易生物讲座:如何开启一个动植物基因组三代de novo项目? 阅读全文
posted @ 2020-12-13 21:00 生物信息与育种 阅读(708) 评论(0) 推荐(0)
摘要:1.混合测序基础 测序成本虽然下降了,但对于植物育种应用研究来说还是很高,动不动就上百群体,小小植物个体价值又低,测完了很可能后面就用不到了。这时,混合样本测序是一种省钱的好办法。 混池测序(Pool-seq)相对于GWAS或其他精细定位策略而言,其实是一个初定位产品,其结果很有可能是跟性状相关的候 阅读全文
posted @ 2020-12-09 21:24 生物信息与育种 阅读(4073) 评论(0) 推荐(0)
摘要:转自公众号Eric生信小班。学习群体遗传套路 中科院昆明动物园吴东东研究团队联合国外研究团队2019年在Genome Biology发表题为Whole genomes and transcriptomes reveal adaptation and domestication of pistachi 阅读全文
posted @ 2020-11-12 12:14 生物信息与育种 阅读(1254) 评论(0) 推荐(0)
摘要:转自公众号Mol Plant植物科学,学习三代组装策略 PacBio+BioNano+Hi-C+遗传图谱 薏苡,又称薏米或薏苡仁,起源于亚洲,是远古乃至中国夏商时代最重要的作物之一。据文献记载及考古学发现互相印证,薏苡在中国有~7000年的栽培和驯化历史[1]。薏苡除了作为我国原产的传统药、食两用经 阅读全文
posted @ 2020-11-12 12:06 生物信息与育种 阅读(598) 评论(0) 推荐(0)
摘要:转自希望组公众号。学习二代+三代组装策略的流程 垂枝桦(Betula pendula)是一种速生乔木,能在短短一年时间内开花,木质坚实,可做细工、家具等,经济价值极高。近日,芬兰研究人员对垂枝桦自交系个体进行全基因组测序,并对80个来自不同地理范围的桦树个体进行群体重测序,为林木基因组学研究和遗传改 阅读全文
posted @ 2020-11-12 11:46 生物信息与育种 阅读(356) 评论(0) 推荐(0)
摘要:1. 组装算法 一般有基于OLC(Overlap-Layout-Consensus, 先重叠后扩展)和基于DBG(De Brujin Graph)两种组装算法。基于OLC的组装方法适合长序列组装,运行依赖的数据结构需要消耗大量的内存,且运行速度比较慢,错误率高,而DBG组装方法内存消耗相对较低,运算 阅读全文
posted @ 2020-09-01 16:47 生物信息与育种 阅读(8906) 评论(0) 推荐(1)
摘要:肿瘤基础 特点: 疾病,无线增殖 基因相关 细胞进化过程中发展异常,突变积累 概念: germline mutation: 生殖细胞突变 somatic mutation: 体细胞突变,不可遗传 driver mutation 关键突变 passenger mutation 无关紧要 二次打击学说: 阅读全文
posted @ 2020-07-01 23:09 生物信息与育种 阅读(3850) 评论(0) 推荐(0)