摘要: 每过一段时间就要读一遍,看看自己现在到底在哪个等级了。 前几天去南京参加两年一度的全国大会CCBSB2014,今年是第六届,见到许多熟识的前辈和老朋友,也结识了不少新朋友。相比于两年前在哈尔滨开的第五届大会,参会人数又多了100多。连大会特邀报告算上,总共76位学者做口头报告,其中30位学者我之前并阅读全文
posted @ 2017-01-09 15:49 Bioinformation 阅读(332) 评论(0) 编辑
摘要: 转自:http://www.statisticshowto.com/explanatory-variable/ What is an Explanatory Variable? An explanatory variable is a type of independent variable. The two terms are often used interchangeably. But th...阅读全文
posted @ 2017-08-16 21:14 Bioinformation 阅读(4) 评论(0) 编辑
摘要: 在做基因表达分析时必然会要做差异分析(DE) DE的方法主要有两种: Fold change t-test fold change的意思是样本质检表达量的差异倍数,log2 fold change的意思是取log2,这样可以可以让差异特别大的和差异比较小的数值缩小之间的差距。 Q-value,是P-阅读全文
posted @ 2017-08-16 12:08 Bioinformation 阅读(107) 评论(0) 编辑
摘要: 很多时候我们需要从GEO(https://www.ncbi.nlm.nih.gov/geo/)下载RNA-seq数据,一个典型的下载页面是https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE76381(搜 GSE76381)。 这里你会看到数据的总览: GSM2268339 1772067089_A01 GSM2268340 17...阅读全文
posted @ 2017-08-15 16:45 Bioinformation 阅读(9) 评论(0) 编辑
摘要: 作者:greenhillman MultiQC homepage: http://multiqc.info功能:把多个测序结果的qc结果整合成一个报告。支持fastqc、trimmomatic、bowtie、STAR等多种软件结果的整合。 Installation 安装 在已经安装Anaconda的情况下,安装MultiQC非常简单,只要运行如下命令即可:#condaconda install -...阅读全文
posted @ 2017-08-14 22:53 Bioinformation 阅读(13) 评论(0) 编辑
摘要: R不必说,数据统计分析可视化的必备语言,R包开发的门槛比较低,所以现在随便一篇文章都会发表一个自己的R包,这样有好处(各种需求早有人帮你解决了)也有坏处(R包太多,混乱,新手上手较难)。作为生信工程师,日常就是查看别人写的R包,分析数据,然后借鉴、修改,根据自己的需求开发新的R包。 参考: http://blog.fens.me/r-build-package/ R包开发 如何系统地学习 R 语...阅读全文
posted @ 2017-08-14 17:39 Bioinformation 阅读(10) 评论(0) 编辑
摘要: 只有注册用户登录后才能阅读该文。阅读全文
posted @ 2017-08-12 18:31 Bioinformation 阅读(8) 评论(0) 编辑
摘要: 转自:http://blog.fens.me/r-apply/ 前言 刚开始接触R语言时,会听到各种的R语言使用技巧,其中最重要的一条就是不要用循环,效率特别低,要用向量计算代替循环计算。 那么,这是为什么呢?原因在于R的循环操作for和while,都是基于R语言本身来实现的,而向量操作是基于底层的C语言函数实现的,从性能上来看,就会有比较明显的差距了。那么如何使用C的函数来实现向量计算呢,就是...阅读全文
posted @ 2017-08-11 17:57 Bioinformation 阅读(7) 评论(0) 编辑
摘要: 非常有必要搞清楚统计学种一些常用的分布!!! 离散型随机变量分布 1.两点分布/伯努利分布 伯努利分布是二项分布在n=1时的特例。一次随机试验,成功概率为p,失败概率为q=1-p。 伯努利分布 2.二项分布 二项分布(Binomial distribution)是n重伯努利试验成功次数的离散概率分布阅读全文
posted @ 2017-08-10 16:37 Bioinformation 阅读(9) 评论(0) 编辑
摘要: Quantitative single-cell rna-seq with unique molecular identifers 这篇文章论证了 scRNA-seq 使用UMI来计算基因表达量的合理性和优势。 这里主要研究如何分析 scRNA-seq 的数据,如何处理ERCC和UMI。 背景: however, losses in cdna synthesis and bias in cdn...阅读全文
posted @ 2017-08-09 17:02 Bioinformation 阅读(6) 评论(0) 编辑
摘要: 转自http://blog.csdn.net/wangtaoking1/article/details/9838571 主要记录一下Shell脚本中的命令的并发和串行执行。 默认的情况下,Shell脚本中的命令是串行执行的,必须等到前一条命令执行完后才执行接下来的命令,但是如果我有一大批的的命令需要执行,而且互相又没有影响的情况下(有影响的话就比较复杂了),那么就要使用命令的并发执行了。 看下...阅读全文
posted @ 2017-08-08 20:23 Bioinformation 阅读(9) 评论(0) 编辑
摘要: 转自:http://blog.csdn.net/wa2003/article/details/45887055 R语言提供了批量处理函数,可以循环遍历某个集合内的所有或部分元素,以简化操作。 这些函数底层是通过C来实现的,所以效率也比手工遍历来的高效。批量处理函数有很重要的apply族函数:lapply sapply apply tapply mapply。apply族函数是高效能计算的运算向量化...阅读全文
posted @ 2017-08-07 20:54 Bioinformation 阅读(4) 评论(0) 编辑
摘要: Bioconductor for Genomic Data Science ftp://ftp.ncbi.nlm.nih.gov/genomes/archive/old_genbank/Bacteria/Halobacterium_sp_uid217/ 下载:AE004437.faa文件阅读全文
posted @ 2017-08-07 17:42 Bioinformation 阅读(12) 评论(0) 编辑
摘要: 参考: 荧光激活细胞分选在干细胞领域的应用 【求助】急!问荧光激活细胞分选技术(FACS)能按癌基因分选细胞吗? 荧光激活细胞分选术分离特定细胞群,实验和临床研究往往需要高纯度的细胞群,荧光激活细胞分选术(FACS)就是一种很好的纯化表型已知细胞群的方法。 荧光激活细胞分选转基因标记斑马鱼神经元阅读全文
posted @ 2017-08-06 21:56 Bioinformation 阅读(4) 评论(0) 编辑
摘要: Spike-in Control:添加/加入(某种物质)的对照(组)在某些情况下,待检验样本中不含待测物质或者含有但是浓度很低,为了证明自己建立的方法能对样本中待测物质进行有效的检测,可在待检样本中加入一定量的待测物质(外标)来进行该方法检测能力的验证。有时,这种加入外标的物质,也可用作为阳性对照。请楼主结合具体的语言环境来确定准确的意思。以下是对楼下战友提供的wiki中关于RNA Spike-i...阅读全文
posted @ 2017-08-05 20:55 Bioinformation 阅读(10) 评论(0) 编辑
摘要: Molecular Diversity of Midbrain Development in Mouse, Human, and Stem Cells 本文作者的官网:Ventral midbrain 顺便找到了:Download all the data and Python Notebooks from GitHub to reproduce the main figures. GitHub:...阅读全文
posted @ 2017-08-04 21:38 Bioinformation 阅读(7) 评论(0) 编辑
摘要: 与之对应的是single cell RNA-Seq,后面也会有类似文章。 参考:https://github.com/xuzhougeng/Learn-Bioinformatics/ 作业:RNA-seq基础入门传送门 资料:RNA-seq Data Analysis-A Practical Approach(2015) Bioinformatic Data Skill biostar hand...阅读全文
posted @ 2017-08-02 16:39 Bioinformation 阅读(21) 评论(0) 编辑
摘要: 参考: 诱导性多能干细胞 Induced pluripotent stem cell Induced Pluripotent Stem Cells: Problems and Advantages when Applying them in Regenerative Medicine Induced pluripotency: history, mechanisms, and applica...阅读全文
posted @ 2017-08-02 11:08 Bioinformation 阅读(6) 评论(0) 编辑
摘要: 转自生信技能树微信公众号,作者果子 距离上次的承诺已经过去了1月,今天就来补上上回的坑。说实话,现在大部分公众号已经创作乏力,我估摸着已经1个月没有点开关注的公众号了,因为在上一个月我就发现,已经没有什么能够让我虎躯一震,要知道在以前我可是每天刷新,不断收藏的,要不然印象笔记里面也不会有1万多条笔记,以前不知道如何分享,权当做自己的精囊,写错了是锦囊,都是在师妹困难的时候发挥作用,而现在,微信允许...阅读全文
posted @ 2017-08-02 10:00 Bioinformation 阅读(26) 评论(0) 编辑
摘要: 说来惭愧,居然没有在Linux安装R的经验,因为一直很少用R,用也是在win平台。 下载路径:https://cran.rstudio.com/src/base/R-3/ 强烈建议不要安装最新的R,除非你有特殊需求,否则你会遇到一大堆问题(加载动态库、包兼容性)。 package 'rhdf5' is not available (for R version 3.2.5) 版本太低也不好,一般选择...阅读全文
posted @ 2017-08-01 21:19 Bioinformation 阅读(9) 评论(0) 编辑
摘要: mismatch到底只是一个碱基替换,还是也包括了插入缺失? If two sequences in an alignment share a common ancestor, mismatches can be interpreted as point mutations and gaps as indels (that is, insertion or deletion mutations) ...阅读全文
posted @ 2017-08-01 10:11 Bioinformation 阅读(11) 评论(0) 编辑
TOP