摘要: ERCC的调研 在RNA-seq数据分析中,为了比较不同样本、不同基因之间的表达差异,通常会对数据进行标准化转化,得到RPKM/FPKM/TPM等指标。但是这些指标都是相对定量,相对定量有两个前提:1是绝大多数的gene表达量不变;2是高表达量的gene表达量不发生改变。 可是在一些比较特殊的样本体 阅读全文
posted @ 2020-02-25 17:45 吴增丁 阅读(4225) 评论(0) 推荐(0) 编辑
摘要: 为了方便记忆,收藏备用 一 linestyle 二marker style 三 matplotlib中color可用的颜色 阅读全文
posted @ 2019-03-21 16:17 吴增丁 阅读(201) 评论(0) 推荐(0) 编辑
摘要: 巧妙利用别称 alias,让工作更有效率 在我的个人目录下/home/zdwu,打开.bashrc文件进行修改: 将 ll='ls -alF' 改为 ll='ls -ahlF',是的观察的结果显示更符合人性,比如文件大小是1.2G,而不是一串长长的数字 阅读全文
posted @ 2019-03-14 14:43 吴增丁 阅读(172) 评论(0) 推荐(0) 编辑
摘要: 转载地址: https://www.cnblogs.com/yahengwang/p/9361101.html 1. 基因转录本亚型 蛋白质亚型或“蛋白质变体“是一组高度相似的蛋白质成员,这些成员来源于单个基因或基因家族,是遗传差异造成的结果。虽然许多具有相同或相似的生物学作用,但一些亚型具有独特的 阅读全文
posted @ 2019-03-12 17:25 吴增丁 阅读(2109) 评论(0) 推荐(0) 编辑
摘要: 场景: 在一个遍历的的程序中,有一步需要调用函数,调用的方式是根据输入参数,从3个可供被调用的函数中,选择其中一个。所以写了一个dict={1:"function_a_name",2:"function_b_name",3:"function_c_name"} 。这时需要将函数转化成可执行的代码。 阅读全文
posted @ 2018-09-29 14:51 吴增丁 阅读(3008) 评论(0) 推荐(0) 编辑
摘要: duplicate的三个问题: 一.什么是duplicate? 二.duplicate来源? 三.既然PCR将1个reads复制得到成百上千copies,那为什么二代数据duplicate rate 一般才10+%? 什么是 duplicate? 摘自罗俊峰博士,阅尔基因研发总监陈云地博士,阅尔基因 阅读全文
posted @ 2018-09-26 12:16 吴增丁 阅读(1790) 评论(0) 推荐(0) 编辑
摘要: 湿实验好久没做,防止基础知识不牢固,最近看到一篇建库的文章,觉得不错,搜集如下: 转载自知乎 https://zhuanlan.zhihu.com/p/25190448 Illumina 平台二代测序文库构建原理简介 来一波Illumina二代测序文库构建原理介绍。一个制备好的Illumina二代测 阅读全文
posted @ 2018-09-26 10:45 吴增丁 阅读(10040) 评论(0) 推荐(0) 编辑
摘要: 应健明的邀请,我也写一篇关于转行做生物信息的心得,本来以为很轻松就可以写出来的,但是发现并不那么好写。如果放在去年刚转岗之时,我想应该更顺手,那时感触良多且深刻。不过我虽是个健忘的人,但是还清醒地记得去年7月份通过公司的转岗答辩之时,心情无比的愉快与美丽,觉得终于从一名生信爱好者成为一名正规军。之前 阅读全文
posted @ 2018-08-21 20:29 吴增丁 阅读(930) 评论(0) 推荐(1) 编辑
摘要: python模块之——openpyxl 处理xlsx/ xlsm文件 项目原因需要编辑excel文件,经过查询,最先尝试xlwt 、wlrd这个两个模块,但是很快发现这两个模块只能编辑xls文件,然而office07 之后的excel默认保存格式都是xlsx / xlsm,所以xlwt 、wlrd解 阅读全文
posted @ 2018-07-04 10:21 吴增丁 阅读(1478) 评论(0) 推荐(0) 编辑
摘要: getopt的两个模块getopt和gun_getopt都可以接收参数,但是又有不同; 先看 getopt.getopt这个模块: 在命令行运行并得到结果,从结果看到-c 和-s 都得到正确解析,如下图: 但是如果我们换一种输入参数,得到结果不能正确解析,如下图: 发现从5之后就没有解析,这些没有解 阅读全文
posted @ 2018-06-14 11:24 吴增丁 阅读(467) 评论(0) 推荐(0) 编辑