随笔分类 - 工具
摘要:软件简介 SNP-sites 是由英国桑格研究所(Sanger Institute)开发的一款开源生物信息学工具,用于快速从多序列比对(Multiple Sequence Alignment, MSA)文件中提取单核苷酸多态性(SNP)位点。随着测序成本下降,微生物和动植物群体研究中样本数量大幅增加
阅读全文
摘要:目前各种方法已被广泛用于基因型插补,但要插补某些基因组区域和大型结构变异仍然具有挑战性。2025年1月,《Nature Communications 》发表了一个基于transformer的框架——STICI,用于精确的基因型插补。 基因型成本仍然是育种的重要痛点之一,填补方法没有很好地用起来,可以
阅读全文
摘要:近期,研究团队在Bioinformatics上发表了最新研究成果,团队开发了 wgatools——一款基于 Rust 语言的高效工具包,支持全基因组比对数据的格 式转换、处理分析、变异检测及可视化。该工具凭借其跨平台兼容性、超高速处理能力以及 对大规模数据的支持,已在多基因组研究项目中展现重要价值,
阅读全文
摘要:很多学术研究的数据上传到Figshare和Zenodo数据库中,在国内从这些网站下载数据速度很慢且经常掉线。一般来说,超过100Mb的文件登梯子很难下载下来。 我尝试利用Google云(https://drive.google.com/drive)的Colab下载到云盘,再下载到本地,曲线救国,特记
阅读全文
摘要:随着高通量测序技术的快速发展,越来越多的物种开展基因组组装、注释以及比较基因组学研究。尽管已有各类工具可以分别处理这些步骤,但用户对能够整合这些不同工具的需求日益增加。在此,我们介绍JCVI库,这是一个功能多样的基于Python的库,其模块化设计能够处理格式解析、图形生成、基因组挂载和植物表型提取等
阅读全文
摘要:近日,中国农业科学院深圳农业基因组研究所刘毓文课题组与广西大学赵云翔课题组合作,在基因组育种共性技术领域取得了重要创新性突破。相关研究成果以《DPImpute: A Genotype Imputation Framework for Ultra-low Coverage Whole-genome S
阅读全文
摘要:在生物信息学领域,数据分析的复杂性和数据量的爆炸式增长,使得搭建自动化分析流程成为刚需。然而,面对众多的工作流管理工具(如 Snakemake、Nextflow、Cromwell/WDL、Galaxy 等),你可能会陷入选择困难症:“到底该用哪个?” 别急!今天我们就来聊聊这些工具的特点,并帮你找到
阅读全文
摘要:分享一篇近期由华为和阿卜杜拉国王科技大学合作完成的一项生信分析与大语言模型相结合的工作,相关成果发表在《Advanced Science》上。 该文介绍了一个名为AutoBA(Automated Bioinformatics Analysis)的人工智能代理,它专门设计用于全面自动化的多组学分析。A
阅读全文
摘要:生信人员基本都是半路出家的野路子,大多没有系统学习过IT知识,只是在终端运行一些简单命令。而IT人员往往不懂生物、不懂统计、也不懂生信,因此要开发生物领域的系统和平台往往需要双方通力合作完成。 假设问题 假设你是生信人员,有一个命令行是:vcftools --vcf input.vcf --max-
阅读全文
摘要:DNA Subway 是一个综合性的生物信息学资源平台,由 CyVerse 开发,旨在提供一个教育性的生物信息学平台,通过将研究级的生物信息学工具、高性能计算和数据库整合到工作流程中,使得用户能够通过一个易于使用的界面进行基因预测、基因注释、基因组分析、系统发育分析和下一代测序数据的分析。 地址:h
阅读全文
摘要:CherryPy 是一个用于构建 Web 应用的微框架。它通过简洁的 API 和强大的功能,使开发者能够快速创建高性能的 Web 应用。在生物信息开发中,数据库搭建和模型部署等场景可能会用到,因此记录下。 学习资源 官方文档:https://docs.cherrypy.dev/en/latest/
阅读全文
摘要:所有的软件产品都值得用AI重塑一次,基因组工具也不例外。 今日分享一篇发表在Nature子刊上的文章:Neural ADMIXTURE for rapid genomic clustering。Neural Admixture可替代Admixture,实现快速计算。 原理 Neural ADMIXT
阅读全文
摘要:分享一篇近期发表在 Genome Biology 上 的一个基因家族分析软件:Seqrutinator。该软件用于识别和去除基因家族数据集中的无功能基因,包括假基因、测序错误、基因结构错误、比对错误等,从而避免基因家族鉴定中的假阳性结果,进一步确保基因家族注释的准确性,以便于后续系统发育分析和功能聚
阅读全文
摘要:分享一篇Y叔(余光创)联合同行老师近期在The Innovation Life上发表的综述文章:Bioinformatics software development: Principles and future directions。文章主要讨论了生物信息学软件开发的原则和未来的发展方向,强调了人
阅读全文
摘要:GATK(Genome Analysis Toolkit)中的joint calling是一种变异检测策略,它允许同时对多个样本进行变异位点的分析,以提高变异检测的准确性和效率。 以下是joint calling的一些关键原理和优势: 数据共享:在joint calling过程中,信息在所有样本间共
阅读全文
摘要:分享一篇最近发表在NC的一篇文章:CoPheScan: phenome-wide association studies accounting for linkage disequilibrium。文章介绍了一种新的贝叶斯方法CoPheScan(Coloc adapted Phenome-wide
阅读全文
摘要:“ 近日,《自然·植物(Nature Plants)》在线发表了中国农业科学院深圳农业基因组研究所(岭南现代农业科学与技术广东省实验室深圳分中心,以下简称“基因组所”)张兴坦团队联合南方科技大学陈国安副教授课题组、湖南农业大学易自力教授团队的研究论文,题为“Chromosome-level scaf
阅读全文
摘要:基于长reads进行结构变异的工具有很多,很多文章也进行过综合比较。今天分享一个新工具VolcanoSV。 Github: https://github.com/maiziezhoulab/VolcanoSV 结构变异(SV)对人类基因组多样性有重要贡献,并在精准医学中发挥关键作用。尽管单分子长读序
阅读全文
摘要:Liftoff 是一个可以准确根据同一物种或近缘物种基因组进行基因注释映射的工具(与liftOver进行不同基因组版本的染色体位置转换有点类似)。该工具仅需两个基因组序列和参考基因组的基因注释文件即可进行基因注释。 Liftoff使用minimap2将参考基因组的基因序列与目标基因组比对,这样的好处
阅读全文
摘要:Resistify是一个用于快速且准确地注释植物中的NLRs(Nucleotide-binding domain Leucine-rich Repeat,核苷酸结合域富含亮氨酸重复序列)并提供准确结构分类的工具。NLRs是植物先天免疫系统的关键组成部分,具有显著的存在/缺失变异和序列多样性。Resi
阅读全文

浙公网安备 33010602011771号