随笔分类 -  工具

摘要:homology策略预测基因结构,下载了公共mRNA/CDS序列,考虑用gmap比对。本来是个很简单的脚本,但总是不那么顺利。 无论是用conda安装,还是源码安装较新版本,都存在问题。 gmap_build -D ./ -d reference reference.fa gmap -t 10 -D 阅读全文
posted @ 2021-04-15 22:43 生物信息与育种 阅读(1945) 评论(0) 推荐(0)
摘要:1.conda安装 conda安装虽然简单,但还是有很多坑,而且很多都是隐形的坑。 # conda install -c bioconda repeatmasker conda install -c bioconda repeatmodeler repeatmodeler依赖于repeatmaske 阅读全文
posted @ 2021-04-06 22:59 生物信息与育种 阅读(9289) 评论(2) 推荐(1)
摘要:1. 主要纠错类型 上篇HiC挂载软件以及如何用Juice_box手工纠错?我吐槽了Juicebox操作麻烦,且没有详细文档。今天在3d-dna流程3D de novo assembly (3D-DNA) pipeline中,终于找到Juicebox的官方文档了:http://aidenlab.or 阅读全文
posted @ 2021-03-29 18:12 生物信息与育种 阅读(4991) 评论(0) 推荐(1)
摘要:1.常用HiC挂载软件 ALLHiC 张兴坦老师专为多倍体和高杂合度物种基因组挂载开发。如果是复杂基因组,肯定是首选。对于简单基因组,我跑了下,结果不佳。提了issue,张老师特意开发了个为简单基因组设计的流程:https://github.com/tangerzhang/ALLHiC/blob/m 阅读全文
posted @ 2021-03-28 23:18 生物信息与育种 阅读(6161) 评论(0) 推荐(0)
摘要:需求 客户的一个简单需求: 我有一批功能基因位点,想从重测序的群体材料中找到这些位点,如何批量快速获得? 示例文件 gene.txt test.vcf 代码实现 run.sh cat $1 |while read gene chr from to do #echo $chr $from $to if 阅读全文
posted @ 2021-03-13 23:04 生物信息与育种 阅读(7649) 评论(0) 推荐(1)
摘要:1.原理的区别 主要区别在于,非加权组平均法(UPGMA)是基于平均链接方法的聚集层次聚类方法,而邻接法(NJ)是基于最小演化准则的迭代聚类法。 UPGMA的假定条件是:在进化过程中,每一世系发生趋异的次数相同,即核苷酸或氨基酸的替换速率是均等且恒定的。 UPGMA生成有根树,而NJ生成无根树。由于 阅读全文
posted @ 2021-03-05 18:08 生物信息与育种 阅读(12809) 评论(0) 推荐(0)
摘要:网上有一些很详细的教程,我这里只记录要点,其余部分按以下教程步骤来就行。 1. PicGo安装 国内下载可能较慢,取决于你的网速。下载安装好后,需要安装nodejs 和gitee插件,直接在PicGo上安装可能很慢,建议用npm在命令行安装gitee插件。 npm install picgo-plu 阅读全文
posted @ 2021-02-26 11:00 生物信息与育种 阅读(170) 评论(0) 推荐(0)
摘要:记录下下载过程,为自己和后人避坑。 1.Conda连接不上镜像源问题 首先是anaconda安装软件或创建环境时遇到的问题。即使换完清华源和其他镜像源以后依旧报错。 CondaHTTPError: HTTP 000 CONNECTION FAILED for url <https://mirrors 阅读全文
posted @ 2021-02-03 14:14 生物信息与育种 阅读(6187) 评论(0) 推荐(0)
摘要:前言 虽然我的win版本R已经用4了,但之前在Linux环境一直没用R4.0,因为Linux涉及的东西太多,担心不稳定,牵一发而动全身。 但现在有好些R包必须要用更新到R4.0以上才能用了(主要是Rcpp版本太低),有的包本身升级时也要考虑不同版本的R,不更新一些函数功能用不了。 今天又碰到了这个问 阅读全文
posted @ 2021-01-12 15:17 生物信息与育种 阅读(11090) 评论(0) 推荐(1)
摘要:Wox是快速搜索小工具,内置了everything(需要先安装),但比everything好用。不止是搜文件,网页、系统等都可以快速搜索,还可以自定义。 下载安装 地址:https://github.com/Wox-launcher/Wox/releases 插件地址:http://www.wox. 阅读全文
posted @ 2020-12-24 21:14 生物信息与育种 阅读(927) 评论(0) 推荐(0)
摘要:最近安装github上的R包,经常显示Error in utils::download.file(url, path, method = method, quiet = quiet, : 无法打开URL'https://api.github.com/repos/之类的错误。起初以为是网络的问题,换了 阅读全文
posted @ 2020-12-02 22:43 生物信息与育种 阅读(14510) 评论(0) 推荐(0)
摘要:1.分析软件 很多很多软件,最常用的有: MEGA PHYLIP 构建进化树一般的步骤是:序列比对,构树(距离法,独立元素法),Booststrap验证。 通常如果是fasta序列,选用方法和软件直接构建就好。 如果要从vcf或hapmap等格式文件构建,则需要做一些处理。可以用类似SNPhylo的 阅读全文
posted @ 2020-10-26 19:57 生物信息与育种 阅读(5225) 评论(0) 推荐(0)
摘要:之前一直用的putty,现在改用Xshell了,首次配置记录下,免得以后折腾。 双击复制,右击粘贴 双击复制全路径 将以下分隔符中默认的.(点),-(减号),/(反斜杠)去掉,注意不要重置,确定即可。 复制窗口:双击窗口 编码:设置utf-8 终端——编码-utf-8 外观设置: 窗口化文件传输 搭 阅读全文
posted @ 2020-10-19 21:59 生物信息与育种 阅读(751) 评论(0) 推荐(0)
摘要:服务器部署简介 之前学过一点点R shiny,但只是自己随便在本地R中试用,没试过部署服务器。最近老板要我写个小工具供用户使用,没搞过,头有点大。 一般地,可将shiny部署在shinyapps.io上,适合小工具,但免费数量有限,国外服务器访问慢,不宜公开部署。 部署示例代码: #### 部署在s 阅读全文
posted @ 2020-10-14 22:38 生物信息与育种 阅读(2923) 评论(0) 推荐(0)
摘要:生信人员主要还是做序列信息的数据分析,平时自己的工作,直接跑代码运行得到结果。但如果要开发一个小工具给普通用户使用,就一个简单的上传数据,然后得到数据分析的结果,这就难倒了一大批人。前端的展示甚至比功能代码部分更让人头疼,CSS+HTML+Javascript了解一下,Django、Flask、To 阅读全文
posted @ 2020-10-11 23:09 生物信息与育种 阅读(470) 评论(1) 推荐(0)
摘要:1.准备本地数据库文件 NR(Non-Redundant Protein Sequence Database)非冗余蛋白库,是所有GenBank+EMBL+DDBJ+PDB中的非冗余蛋白序列。Taxonomy物种分类数据库,包括大于7万余个物种的名字和系谱,这些物种都至少在遗传数据库中有一条核酸或蛋 阅读全文
posted @ 2020-09-26 20:27 生物信息与育种 阅读(3271) 评论(0) 推荐(1)
摘要:根据相似性原理,序列相似,功能相似,所有功能注释无非是用比对工具将输入序列比对到数据库序列,再将输入ID对应数据库ID,进一步对应到功能条目的关系。 数据库要么建到本地,要么联网调用API,一般的软件或包做注释都是通过联网来获得,或者调用依赖的一些专门注释的包(文件较大)。工业生产中,一般需要构建本 阅读全文
posted @ 2020-09-25 22:55 生物信息与育种 阅读(1212) 评论(1) 推荐(0)
摘要:2015年的综述文章,marker一下,供以后比较试用。蛋白质基因组学研究中的质谱仪与生物信息学方法。 针对蛋白质基因组学的分析研究,总结了质谱仪和蛋白质基因组学流程分析软件的选择,重点评述了常用的生物信息学计算工具,如PepLine 、Proteogenomic Mapping Tool InsP 阅读全文
posted @ 2020-08-28 23:58 生物信息与育种 阅读(403) 评论(0) 推荐(0)
摘要:1.简介 2016年,德国马普所的Cox和蛋白质组学领域巨擘Matthias Mann合作开发了MaxQuant软件(MQ),并发表在nbt上,protocol也相应发表在nature protocols上。不足五年,MQ的引用率已高达上万次,其中不乏CNS级别文章(有大佬的加持果然不一样)。毫不夸 阅读全文
posted @ 2020-08-28 23:48 生物信息与育种 阅读(18252) 评论(1) 推荐(0)
摘要:1.简介 PD全称Proteome Discoverer,是ThermoFisher在2008年推出的商业Windows软件,没错,收费,还不菲。而且主要也是针对他们家的obitrap产出数据。但在业内用得比较多,尤其是在学术界(因为大部分科研人员只会鼠标点点框)。蛋疼的是你就算买了软件还得配个Wi 阅读全文
posted @ 2020-08-28 21:33 生物信息与育种 阅读(7084) 评论(0) 推荐(0)