随笔分类 - 工具
摘要:目录模型部署概述R语言模型云端/服务器部署httpuvjugopencpufieryplumberRserveRestRserve结语 模型部署概述 数据科学项目的生命周期通常以迭代方式执行以下主要阶段: 业务理解(Business understanding) 数据采集和理解(Data acqui
阅读全文
摘要:目录需求描述尝试解决正确解决 需求描述 一个很简单的需求:一批水稻材料的芯片数据(位点少),想看看它们在3K Rice中处于何种亚群和位置。就需要将芯片位点与3K RG位点整合后进行分析。 已知3K Rice位点可从SNP-Seek中下载:https://snp-seek.irri.org/_dow
阅读全文
摘要:目录简介材料方法数据集SoyDNGP的模型结构比对模型的处理主要结果SoyDNGP在大豆基因组预测中展现了出色的能力大豆基因组预测中SoyDNGP与其他算法的性能比较SoyDNGP模型在不同大豆群体中的多功能预测能力SoyDNGP 在大豆之外的广泛应用SoyDNGP是一个面向大豆基因组预测的开放友好
阅读全文
摘要:目录问题解决 问题 Python通过pip安装PyVCF成功,但运行脚本时出现问题: File "/home/theo/anaconda3/lib/python3.9/site-packages/vcftoolz/vcftoolz.py", line 19, in <module> import v
阅读全文
摘要:目录关于GLNexus由于重叠变异产生的half-callsGATK joint calling对于half-calls的处理建议处理 关于GLNexus GLnexus是由DNAnexus开发,用于可扩展的gVCF合并和联合变异(joint calling)要求群体测序项目,GL即genotype
阅读全文
摘要:[toc] ## 需求描述 vcf是标准的基因型格式文件,其中包含的信息可多可少。主要在于INFO可无限扩展特征,以及每个样本的FORMAT信息,会大大增加vcf文件的大小。一般来说,GATK等软件得到的基因型都会有这些信息,初始变异我们最好保留它们,因为这是过滤位点/样本的依据。但是当我们确定了最
阅读全文
摘要:这个问题网上已经有一堆回答了,如: [解决Jupyter-notebook不自动跳转浏览器的详细方法](https://zhuanlan.zhihu.com/p/435414400) [Python基础090:解决jupyter notebook无法自动跳转chrome浏览器的问题](https:/
阅读全文
摘要:## 环境依赖 ``` sudo yum update -y && \ yum groupinstall -y 'Development Tools' && \ yum install -y \ openssl-devel \ libuuid-devel \ libseccomp-devel \ w
阅读全文
摘要:本地上传测序文件到Linux系统,做md5时发现有少数文件失败。 $ cat md5.check 84305_FDSW190448400-1a_1.fq.gz: OK 84305_FDSW190448400-1a_2.fq.gz: FAILED md5sum: WARNING: 1 computed
阅读全文
摘要:爱达荷大学的统计学顾问Julia Piaskowski总结的关于R包在农业研究领域应用的一个概括。 关于Julia Piaskowski:https://jpiaskowski.gitlab.io/ 来自agstats_2022_poster 更多信息: https://agstats.io/eve
阅读全文
摘要:当我对两个基因型文件位置取交集,并重新生成两个vcf: $ bcftools view -R overlap.lst variant.filter.vcf.gz -Oz -o 300.vcf.gz 出现如下错误: $ tabix 300.vcf.gz [E::hts_idx_push] Unsort
阅读全文
摘要:Xshell是我用过最好的终端访问服务器的软件,搭配Xftp文件传输,体验很好。不过6及以后版本就收费了,虽然对于学校和家庭使用可以免费,但每次都要强制升级。 Xshell6最多支持4个session。Xshell7可以无限session,但vim编辑文本时,无法通过鼠标回滚到命令行,从而无法复制命
阅读全文
摘要:如题双击无任何反应,以管理员身份也是。 以为是版本问题,结果v6和v7都不行。 以为是win10自带防护拦截,允许应用通过防火墙,结果还是不行。 最后发现是电脑装了火绒,退出后,双击就好了。 如果你装了电脑管家、360,同样退出就好。如果你的其他应用软件也是双击无反应,同理。 参考:https://
阅读全文
摘要:1. 原版 安装比较简单。 wget https://reich.hms.harvard.edu/sites/reich.hms.harvard.edu/files/inline-files/XPCLR.tar tar xvf XPCLR.tar 直接运行bin下的XPCLR即可,若不能运行,则编译
阅读全文
摘要:原始帖 Admixture做群体结构分析是好用,但也有一些不顺手的地方。最大的问题是不支持非整数的染色体号! 相信我们手里绝大部分vcf或plink格式文件,染色体ID基本是文本类型的吧。注意plink处理时加上-allow-extra-chr,若染色体数超过人类,可使用--chr-set设置。 s
阅读全文
摘要:需求 想要把在linux终端操作的习惯改到本机上来。理由如下: linux下的vim对于编程调试不是很方便; 编程与命令不能很好链接,经常要多开几个window或sessions; vim的自动补全不太好使(应该是我没修炼到家); xshell最近更新的版本导致了之前的习惯操作受到严重限制(如vim
阅读全文
摘要:不同基因组版本的位置(坐标)对应关系,在数据分析环节经常用到。 位置对应关系通常通过比对来获取,而信息一般存储在chain文件中。 对于人类、小鼠等模式生物而言,UCSC已经提供了不同版本的chain文件。 对于非模式生物,往往需要先自己制作chian文件,再通过ncbi的remap,UCSC的li
阅读全文
摘要:问题 Outlook 2016一直好好地,最近打开弹窗“需要更新才能启动”,收不了邮件。 解决 在Microsoft官网下载KB5002051补丁,安装重启后问题解决。 https://docs.microsoft.com/en-us/officeupdates/outlook-updates-ms
阅读全文
摘要:GMOD(Generic Model Organism Database) 是专为生物学家创建的开源项目,生物学家用作存储库和工具的交互应用程序和数据库的集合。 连通性是GMOD的关键。生物信息学应用程序和数据库大量产生,但其中许多工具很少使用,因为用户可能缺乏将工具连接到他们数据所需的资源或专业知
阅读全文
摘要:问题描述 客户一个测序原始数据在百度网盘上待分析。一般思路是下载到本地,再转移到服务器。但这样相当于数据转移两次,如果客户不给你账号密码,可能还得转移三次。而百度网盘这尿性,下载会很慢很慢。 解决方案 网上查了下,百度网盘提供了一个开放的api,使用服务器的命令行即可直接下载数据。 pip inst
阅读全文

浙公网安备 33010602011771号