上一页 1 ··· 64 65 66 67 68 69 70 71 72 ··· 95 下一页
摘要: homology策略预测基因结构,下载了公共mRNA/CDS序列,考虑用gmap比对。本来是个很简单的脚本,但总是不那么顺利。 无论是用conda安装,还是源码安装较新版本,都存在问题。 gmap_build -D ./ -d reference reference.fa gmap -t 10 -D 阅读全文
posted @ 2021-04-15 22:43 生物信息与育种 阅读(1908) 评论(0) 推荐(0)
摘要: 需求 一个数据框一列或多列中有重复行,如何将它的重复行转化为多列?即本来两列一对一的关系,如何转化为一对多的关系?普通的spread函数实现较为麻烦。 示例数据如下: Item Value Apricot 4 Apricot 2 Apricot 5 Banana 4 Carrot 7 Carrot 阅读全文
posted @ 2021-04-14 16:02 生物信息与育种 阅读(853) 评论(0) 推荐(0)
摘要: 1.conda安装 conda安装虽然简单,但还是有很多坑,而且很多都是隐形的坑。 # conda install -c bioconda repeatmasker conda install -c bioconda repeatmodeler repeatmodeler依赖于repeatmaske 阅读全文
posted @ 2021-04-06 22:59 生物信息与育种 阅读(9009) 评论(2) 推荐(1)
摘要: 1. 主要纠错类型 上篇HiC挂载软件以及如何用Juice_box手工纠错?我吐槽了Juicebox操作麻烦,且没有详细文档。今天在3d-dna流程3D de novo assembly (3D-DNA) pipeline中,终于找到Juicebox的官方文档了:http://aidenlab.or 阅读全文
posted @ 2021-03-29 18:12 生物信息与育种 阅读(4875) 评论(0) 推荐(1)
摘要: 1.常用HiC挂载软件 ALLHiC 张兴坦老师专为多倍体和高杂合度物种基因组挂载开发。如果是复杂基因组,肯定是首选。对于简单基因组,我跑了下,结果不佳。提了issue,张老师特意开发了个为简单基因组设计的流程:https://github.com/tangerzhang/ALLHiC/blob/m 阅读全文
posted @ 2021-03-28 23:18 生物信息与育种 阅读(5985) 评论(0) 推荐(0)
摘要: 需求 客户随手丢来一个基因型文件,类似于hapmap格式,只是少了中间多余的那几列,像这种类hapmap格式文件,往往是芯片数据。 这样的数据因为缺乏等位基因:参考碱基和变异碱基信息,对应在vcf文件中就是REF和ALT,导致后续一些分析没法进行。 那么,问题来了:怎么根据这个基因型文件来推断参考和 阅读全文
posted @ 2021-03-25 22:26 生物信息与育种 阅读(586) 评论(0) 推荐(0)
摘要: 需求 要写一个接口,同时支持压缩和未压缩文件读入 示例代码 笨办法 import os import gzip filename = sys.argv[1] if not filename.endswith('.gz'): with open(filename, 'r') as infile: fo 阅读全文
posted @ 2021-03-15 16:27 生物信息与育种 阅读(651) 评论(0) 推荐(0)
摘要: 需求 客户的一个简单需求: 我有一批功能基因位点,想从重测序的群体材料中找到这些位点,如何批量快速获得? 示例文件 gene.txt test.vcf 代码实现 run.sh cat $1 |while read gene chr from to do #echo $chr $from $to if 阅读全文
posted @ 2021-03-13 23:04 生物信息与育种 阅读(7435) 评论(0) 推荐(1)
摘要: ln -s 改成 ln -sf f在很多软件的参数中意味着force ln -sf /usr/bin/bazel-1.0.0 /usr/bin/bazel 阅读全文
posted @ 2021-03-10 16:03 生物信息与育种 阅读(2154) 评论(0) 推荐(0)
摘要: 1.原理的区别 主要区别在于,非加权组平均法(UPGMA)是基于平均链接方法的聚集层次聚类方法,而邻接法(NJ)是基于最小演化准则的迭代聚类法。 UPGMA的假定条件是:在进化过程中,每一世系发生趋异的次数相同,即核苷酸或氨基酸的替换速率是均等且恒定的。 UPGMA生成有根树,而NJ生成无根树。由于 阅读全文
posted @ 2021-03-05 18:08 生物信息与育种 阅读(12562) 评论(0) 推荐(0)
上一页 1 ··· 64 65 66 67 68 69 70 71 72 ··· 95 下一页