上一页 1 ··· 23 24 25 26 27 28 29 30 31 ··· 39 下一页
摘要: 2023年03月31日 cellranger pipeline基本是对的,但想要更原始的数据还是得自己手动count。 这两批perturb-seq的问题在于,Plasmid的设计,无法区分原始的和编辑后的Plasmid,长度一样,于是做cell sorting的时候一大堆dummy cells就被 阅读全文
posted @ 2017-07-21 16:19 Life·Intelligence 阅读(3759) 评论(0) 推荐(0)
摘要: 转自:http://blog.csdn.net/lhf_tiger/article/details/8203013 真恶心,10X流程产生的csv文件的行位居然有^M字符,害我一直在找报错原因,真是坑,还好最后我找出来了。一直在用Python,perl是越来越不熟练了。调试花了好久。 替换^M字符在Linux下使用vi来查看一些在Windows下创建的文本文件,有时会发现在行尾有一些“^M”。有几... 阅读全文
posted @ 2017-07-19 22:02 Life·Intelligence 阅读(9846) 评论(0) 推荐(0)
摘要: 业界良心啊,开源的单细胞课程。 随便看了几章,课程写得非常用心,非常适合新手。 课程地址:Analysis of single cell RNA-seq data 源码地址:hemberg-lab/scRNA.seq.course 阅读全文
posted @ 2017-07-13 10:56 Life·Intelligence 阅读(2047) 评论(0) 推荐(1)
摘要: 本文总结自一篇综述: Computational approaches for interpreting scRNA-seq data 单细胞分析分为两个层次: cell level gene level Tools for the visualization and clustering of cells. Tools for the ordering of cells & bifurca... 阅读全文
posted @ 2017-07-12 18:13 Life·Intelligence 阅读(8127) 评论(0) 推荐(0)
摘要: PhiX Control v3 is a reliable, adapter-ligated library used as a control for Illumina sequencing runs. The library is derived from the small, well-characterized PhiX genome, offering several benefits ... 阅读全文
posted @ 2017-07-12 09:56 Life·Intelligence 阅读(763) 评论(0) 推荐(0)
摘要: 小提琴图现在比较流行,在文章里很常见。 【小提琴图】其实是【箱线图】与【核密度图】的结合,【箱线图】展示了分位数的位置,【小提琴图】则展示了任意位置的密度,通过【小提琴图】可以知道哪些位置的密度较高。 实例解析 在上图中,白点是中位数,黑色盒型的范围是下四分位点到上四分位点,细黑线表示须。外部形状即为核密度估计(在概率论中用来估计未知的密度函数,属于非参数检验方法之一)。 数据化分析解读:... 阅读全文
posted @ 2017-07-11 17:28 Life·Intelligence 阅读(17168) 评论(0) 推荐(0)
摘要: ERCC是啥? 外部RNA控制联盟,就是一套RNA-seq,基因表达检测过程中的控制系统,使得结果具有可重复性。 RNA Spike-in Controls for Gene Expression While early gene expression measurements with DNA microarrays were groundbreaking in their ability to... 阅读全文
posted @ 2017-07-11 17:14 Life·Intelligence 阅读(1945) 评论(0) 推荐(0)
摘要: mRNA是由DNA的一条链转录而来的(可以是正链,也可以是反链),DNA是由非编码区和编码区组成,编码区也有其特殊的结构,主要有外显子和内含子组成。 mRNA的一个重要性质就是可变剪切,也就是同一个编码区,可能会有不同的外显子组合。 mRNA的结构:5’端的帽子结构和3’端的polyA尾巴。 polyA和oligo(dT)是什么?它在mRNA纯化和反转录中有什么作用? 传统mRNA差异显示技术(D... 阅读全文
posted @ 2017-07-11 15:01 Life·Intelligence 阅读(2469) 评论(0) 推荐(0)
摘要: 最近在搞16S,发现了一个实践算法的最佳机会。 见文章: A Bayesian taxonomic classification method for 16S rRNA gene sequences with improved species-level accuracy. 文章利用了贝叶斯模型,调用了blast和muscle来对OTU进行taxonomy assignment。 可以看一下源代... 阅读全文
posted @ 2017-07-10 16:58 Life·Intelligence 阅读(1685) 评论(0) 推荐(0)
摘要: 杰卡德距离(Jaccard Distance) 是用来衡量两个集合差异性的一种指标,它是杰卡德相似系数的补集,被定义为1减去Jaccard相似系数。而杰卡德相似系数(Jaccard similarity coefficient),也称杰卡德指数(Jaccard Index),是用来衡量两个集合相似度的一种指标。 Jaccard相似指数用来度量两个集合之间的相似性,它被定义为两个集合交集的元素个数除... 阅读全文
posted @ 2017-07-03 11:07 Life·Intelligence 阅读(1676) 评论(0) 推荐(0)
摘要: 16S结题报告中都会有这么一张图: 这张图是OTU Rank曲线,该曲线可以展示样品的多样性。而样品的多样性常通过以下两个方面进行解释:物种的丰富程度和均匀程度。Rank曲线中,曲线在横轴上的跨度越长,表明样品的物种含量越丰富;曲线越平坦,表示样品的物种组成越均匀。 图中,横坐标按照丰度由高至低排序的OTU数量,纵坐标为OTU丰度。样本曲线的延伸终点的横坐标位置为该样本的OTU数量。若曲线越平滑... 阅读全文
posted @ 2017-06-28 19:03 Life·Intelligence 阅读(8632) 评论(0) 推荐(0)
摘要: 工作中有个真理:如果你连自己所做的工作的来龙去脉都讲不清楚,那你是绝对不可能把这份工作做好的。 这适用于任何行业。如果你支支吾吾,讲不清楚,那么说难听点,你在混日子,没有静下心来工作。 检验标准:随时向别人解释你的工作,让别人提出尖锐的问题,看你是不是答不上来。 16S概念 什么是16S?S是什么意思? 16S分析是用来干嘛的?能分析什么? 16S大致的分析原理是什么? 有点生物学基础的... 阅读全文
posted @ 2017-06-20 10:54 Life·Intelligence 阅读(69783) 评论(0) 推荐(1)
摘要: 上一篇文章写了一些基本的Django操作,下面重点介绍数据库的内容。 对象之间的关系: 一对一 一对多 多对多 1.一对多 先演示一对多的关系,多个blog对应一个名字, 修改blog/models.py class Entry(models.Model): name = models.CharField(max_length=30) def __unicode... 阅读全文
posted @ 2017-06-20 01:42 Life·Intelligence 阅读(420) 评论(0) 推荐(1)
摘要: 参考资料:爬虫课程 认识网页 使用chrome,右键检查,查看网页源码,左侧的html,右侧的css,底下的JavaScript。 网页 = HTML(内容) + CSS(样式) + JavaScript(功能) 网页的标签,标签之间可以嵌套。 wow! 其中div就是区域,p就是文本,class就是css样式。 常见标签 #文字内容 #区域 #列表 #图像 ... 阅读全文
posted @ 2017-06-18 21:16 Life·Intelligence 阅读(368) 评论(0) 推荐(0)
摘要: 最近想做一个数据库网站,我对Python很熟悉,也了解到Django很好用,于是说搞就搞。 首先,在快云上买了一个vps,一元试用一个月,Ubuntu系统。 1.安装Django apt-get update apt-get install python-pip python-dev build-essential python -m pip install django 安装的方法很多,可以自由... 阅读全文
posted @ 2017-06-17 02:15 Life·Intelligence 阅读(1540) 评论(0) 推荐(0)
摘要: 微生物16S的OTU聚类工具有很多,最常用的就是 usearch、cdhit-OTU、mothur。 这些工具大多都是针对二代测序平台的,usearch的64bit版本是收费的。 如果要跑PacBio的OTU聚类,目前就只能用 mothur 了。 mothur有着非常详细的说明文档! General operations Sequence processing OTU-based approac... 阅读全文
posted @ 2017-06-09 15:40 Life·Intelligence 阅读(6691) 评论(0) 推荐(0)
摘要: 一个有效的数据降维的方法 t-SNE,类似PCA的主成分降维分析。 参考: t-分布邻域嵌入算法(t-SNE algorithm)简单理解 t-SNE初学 很好的教程:An illustrated introduction to the t-SNE algorithm 有点复杂额 阅读全文
posted @ 2017-05-26 16:40 Life·Intelligence 阅读(2063) 评论(0) 推荐(1)
摘要: 单细胞流程跑了不少,但依旧看不懂结果,是该好好补补了。 有些人可能会误会,觉得单细胞的RNA-seq数据很好分析,跟分析常规的RNA-seq应该没什么区别。今天的这篇文章2015年3月发表在Nature Genetics Review上,专门说明了一下单细胞RNA测序数据在数据分析和计算上的挑战(虽然已经过去1年多了,这里指出的问题和挑战仍然是不过时的,至于这些问题和挑战现在是不是完美解决了,... 阅读全文
posted @ 2017-05-26 16:06 Life·Intelligence 阅读(16671) 评论(0) 推荐(1)
摘要: 10X Genomics已经广泛应用于单细胞测序、组装领域,现在也是火的不行。 10X Genomics原理 通过将来自相同DNA片段(10-100kb)的reads加上相同的barcode,然后在illumina平台上进行测序,从而实现长片段的测序。其基本原理是同一长片段的reads会具有同样的标 阅读全文
posted @ 2017-05-26 14:49 Life·Intelligence 阅读(6539) 评论(0) 推荐(0)
摘要: 最开始学的就是C和C++,但只是学过,根本就不知道怎么使用。 后来接触了Python和Perl才知道怎么将编程应用于实际需求当中,读取文件,存放到数据结构,处理,输出。 但脚本语言有其固有的缺点,不能用于高速计算。 生物信息的基础是大数据(G~T级别),我们不仅要优化算法,还得选择接近底层的语言,那显然就必须要用到C和C++了,Java都不够快。 现在我接触了一个CNV的C++写的程序,看了源码,... 阅读全文
posted @ 2017-04-17 23:55 Life·Intelligence 阅读(618) 评论(0) 推荐(0)
上一页 1 ··· 23 24 25 26 27 28 29 30 31 ··· 39 下一页
TOP