摘要: 下载pyfaidx pip install pyfaidx faidx all.fa -i chromsizes > all.size 得到的图 阅读全文
posted @ 2021-11-27 10:35 焦糖可丽饼 阅读(137) 评论(0) 推荐(0) 编辑
摘要: 蛋白去重:cd-hit cd-hit -i pro.fa -o new.fa -c 0.9 -aS 0.8 -d 0 阅读全文
posted @ 2021-11-26 15:09 焦糖可丽饼 阅读(34) 评论(0) 推荐(0) 编辑
摘要: 人类基因组中的变异和人类的演化、疾病风险等方面都有着密切的联系。当前二代短读长高通量测序技术(NGS),虽然能够让测序成本大大降低,但这种短读长的测序方法也给基因组的变异检测(特别是结构性变异检测)带来了不小的挑战。SNP和Indel大家应该都见得比较多了,因此在这篇文章里我将主要讨论常见结构性变异 阅读全文
posted @ 2021-11-19 09:24 焦糖可丽饼 阅读(680) 评论(0) 推荐(0) 编辑
摘要: makeblastdb -in ref.nbs.plant.fa -dbtype prot -out blastdb blastp -num_threads 20 -db blastdb -query Arabidopsis_thaliana.TAIR10.pep.all.fa -outfmt 7 阅读全文
posted @ 2021-11-18 23:23 焦糖可丽饼 阅读(48) 评论(0) 推荐(0) 编辑
摘要: 下载植物gff、cds、dna、pep pfam中下载hmm模型 搜索基因家族并以1e-20筛选 hmmsearch --cut_tc --domtblout NBS-ABC.out NBS-ARC.hmm Arabidopsis_thaliana.TAIR10.pep.all.fa grep -v 阅读全文
posted @ 2021-11-18 23:18 焦糖可丽饼 阅读(517) 评论(0) 推荐(0) 编辑
摘要: 首先QTL是数量性状位点,比如身高是一个数量性状,其对应的控制基因的位点就是一个数量性状位点,而eQTL就是控制数量性状表达位点,即能控制数量性状基因(如身高基因)表达水平高低的那些基因的位点。 数量性状基因座:控制数量性状的基因在基因组中的位置称数量性状基因座。常利用DNA分子标记技术对这些区域进 阅读全文
posted @ 2021-11-18 17:43 焦糖可丽饼 阅读(785) 评论(0) 推荐(0) 编辑
摘要: 又是一篇转载,最近在学相关知识 RNA测序并不能直接使用DNA测序常用的BWA、Bowtie等比对软件,这是由于真核生物内含子的存在,导致测到的reads并不与基因组序列完全一致(如下图所示),因此需要使用Tophat/HISAT/STAR等专门为RNA测序设计的软件进行比对。 基因组比对: Top 阅读全文
posted @ 2021-11-18 17:16 焦糖可丽饼 阅读(446) 评论(0) 推荐(0) 编辑
摘要: 中午试了很久aspera下载ncbi的数据,但是ncbi上的网址已经在2019年后不能用了 所以改成ena的网址,可以实现快速下载 将需要下载的文献在 https://www.ebi.ac.uk/ena/browser/home 找到下载地址 整理成这样的格式:era-fasp@fasp.sra.e 阅读全文
posted @ 2021-11-17 23:08 焦糖可丽饼 阅读(164) 评论(0) 推荐(0) 编辑
摘要: 转载来自https://zhuanlan.zhihu.com/p/393674599 写的非常好 怕找不到留着自己看!如果作者不同意我会删除。 前言 接下来我们要介绍的是 RNA-seq 数据的处理分析流程,根据 RNA-seq 测序技术的不同,可以分为三种: Stark et al. Nat Re 阅读全文
posted @ 2021-11-17 23:05 焦糖可丽饼 阅读(8473) 评论(0) 推荐(0) 编辑
摘要: 最近在研究转录本,现在在下载数据,想起来自己有一个博客,就暂且来这里更新一下内容。 要想对转录本进行定量,首先需要下载它的转录组数据,将别人上传的SRR文件的名字整理在wheat.txt中,引用 prefetch --option-file wheat.txt 下载后通过sratoolkits将sr 阅读全文
posted @ 2021-11-14 20:48 焦糖可丽饼 阅读(933) 评论(0) 推荐(0) 编辑