上一页 1 ··· 65 66 67 68 69 70 71 72 73 ··· 95 下一页
摘要: 下了一些sra数据库中的公共数据,因为pretech和aspera不稳定,稍微大点的文件经常传断,部分文件我只能通过本地下载再上传。 那么问题来了,sra没有md5校验,我怎么知道我数据的完整性,尤其是通过本地下载的那些数据? 网上查了下是说,sra是自带md5校验的(The SRA archive 阅读全文
posted @ 2021-03-05 11:15 生物信息与育种 阅读(2929) 评论(0) 推荐(0)
摘要: python写流程控制的时候,有时需要等待运行结果完成才能进行下一步。有几个想法: 一是反复循环判断直到生成结果文件(且文件中有预期结果),低效易出错; 二是用subprocess模块来判断进程结果,较为常用; 三是用drmaa包,功能强大,但使用相对复杂。 这次介绍如何用subprocess来实现 阅读全文
posted @ 2021-03-05 11:03 生物信息与育种 阅读(5508) 评论(0) 推荐(0)
摘要: 网上有一些很详细的教程,我这里只记录要点,其余部分按以下教程步骤来就行。 1. PicGo安装 国内下载可能较慢,取决于你的网速。下载安装好后,需要安装nodejs 和gitee插件,直接在PicGo上安装可能很慢,建议用npm在命令行安装gitee插件。 npm install picgo-plu 阅读全文
posted @ 2021-02-26 11:00 生物信息与育种 阅读(154) 评论(0) 推荐(0)
摘要: 1. 什么是单倍型? 同源染色体:同源染色体,一个来自母本,一个来自于父本。 单倍型:单倍体基因型的简称。遗传学上指在单条染色体上一系列遗传变异位点的组合。 2. 单倍型组装的意义? 目前,大多数二倍体基因组组装都忽略了同源染色体之间的差异,将基因组组装成一个假的单倍体序列,这是二倍体类型的组装的人 阅读全文
posted @ 2021-02-08 17:28 生物信息与育种 阅读(2527) 评论(0) 推荐(0)
摘要: 前言 王向峰老师2020年发表在《Genomics Proteomics Bioinformatics》(IF=6.597)上的文章。对于做数据分析的人来说,如何挖掘公共数据,如何从海量SNP中挖掘目标SNP等问题都是每天要面对的,这篇文章给了一个参考,很值得学习。 文章从水稻变异数据库RVD的子库 阅读全文
posted @ 2021-02-06 17:12 生物信息与育种 阅读(1407) 评论(0) 推荐(0)
摘要: 记录下下载过程,为自己和后人避坑。 1.Conda连接不上镜像源问题 首先是anaconda安装软件或创建环境时遇到的问题。即使换完清华源和其他镜像源以后依旧报错。 CondaHTTPError: HTTP 000 CONNECTION FAILED for url <https://mirrors 阅读全文
posted @ 2021-02-03 14:14 生物信息与育种 阅读(6097) 评论(0) 推荐(0)
摘要: 前言 植物基因组大小跨越几个数量级,倍性和杂合性变化,以及新旧基因组转座子变化等带来组装挑战。三代和物理图谱提供了新机会,单倍型定相、结构变异分析、从头泛基因组研究成为新兴组装热点。 植物基因组发展: 拟南芥:sanger BAC-by-BAC。 shotgun OLC (CELERA assemb 阅读全文
posted @ 2021-02-02 20:08 生物信息与育种 阅读(859) 评论(0) 推荐(0)
摘要: 1. 建立项目团体 多机构合作,数据和利益共享。 2. 收集目标基因组信息 考虑的因素: 基因组大小、倍性、杂合性、GC含量和重复。 数据库查询: fungi (http://www.zbi.ee/fungalgenomesize) animals (http://www.genomesize.co 阅读全文
posted @ 2021-02-01 22:35 生物信息与育种 阅读(1253) 评论(0) 推荐(1)
摘要: 安装R包时这个错误是经常见到的。我认为有几个方法可解决,记录之。 1. 更新R(不推荐) 简单粗暴的方法就是更新R,但这波及的范围太大了,不到万不得已不建议。 2. 更改或指定镜像源 出现这个问题很有可能是你现在用的镜像中未纳入这个包,一是可以多换个源试试。如: install.packages(' 阅读全文
posted @ 2021-01-20 09:49 生物信息与育种 阅读(65370) 评论(0) 推荐(0)
摘要: 单倍型,即单倍体基因型,概念很好理解。 单倍型分型的过程就称之Phasing,定相或基因分型。 Phasing的意义,在人类疾病遗传和动植物群体遗传中非常重要。也是imputation的必经过程。 vcf文件中,./.和.|.分别表示未定相和已定相。 Phasing的方法: 家系定相,最准确,一般根 阅读全文
posted @ 2021-01-14 15:24 生物信息与育种 阅读(2408) 评论(0) 推荐(0)
上一页 1 ··· 65 66 67 68 69 70 71 72 73 ··· 95 下一页