摘要: 大学层次的统计学: 假设检验 参数估计 抽样(总体和样本) 贝叶斯 高级: 多元统计分析 概率论 常用的分布: 二项分布 泊松分布 正态分布 超几何分布 各种分布:二项分布 & 泊松分布 & 指数分布 随机事件的概率 随机变量的分布 随机变量的函数 随机变量的数字特... 阅读全文
posted @ 2016-11-16 23:19 Life·Intelligence 阅读(340) 评论(0) 推荐(0)
摘要: 单分子测序reads(PB)的混合纠错和denovo组装 我们广泛使用的PBcR的原始文章就是这一篇 原文链接:Hybrid error correction and de novo assembly of single-molecule sequencing reads 简介:PBcR里面有一种自纠算法(PacBioToCA),纠错的核心本质就是多重序列比对,为了加快比对速度使用了MHAP... 阅读全文
posted @ 2016-11-15 23:38 Life·Intelligence 阅读(2322) 评论(0) 推荐(0)
摘要: 写的零碎的python脚本太多了,到一定阶段就会出现一个问题,即以前写过的脚本找不到了,现在临时要用,还得再重写一遍,这就非常难受了,代码不能复用。 还好我有一个比较好的习惯,我喜欢把python脚本里面的核心功能封装成一个函数,即一个函数只实现一个特定的功能,我希望将我封装过得函数全部存起来,规范命名,以后要用的时候随时调用。 阅读全文
posted @ 2016-11-14 16:24 Life·Intelligence 阅读(436) 评论(0) 推荐(1)
摘要: 很早就知道有全局比对和局部比对这两种比对方法,都是用到的动态规划的思想,知道一些罚分矩阵的概念,但一直都没有机会搞透彻,一些算法的细节也不太清楚,也没有亲手编程实现。 现在由于项目需求,需要手动写一个简单的全局和局部比对的程序,同时得知团队里有个大牛早就用Perl实现了,看了一下他的代码也才100行,于是我打算从头开始全面的弄懂算法的每一个细节,然后再用python实现一遍。 阅读全文
posted @ 2016-11-10 12:45 Life·Intelligence 阅读(5073) 评论(0) 推荐(0)
摘要: 用GATK跑了很久的流程,但还是不知道它的原理,现在项目要深入,没有流程可用,一切都要手动,所以必须开始着手了解GATK运行的原理,必须要知道需要输入什么,基本的算法,输出是什么。 参见: GATK使用(一) 【原创】GATK使用方法详解(包含bwa使用)第一部分 阅读全文
posted @ 2016-11-09 09:46 Life·Intelligence 阅读(2620) 评论(0) 推荐(0)
摘要: 主要是收集一些Linux的技巧: 1.编写可靠shell脚本的八个建议 指定bash,推荐使用 /usr/bin/env bash 和 /bin/bash,不要使用/usr/bin/bash。 set -e 和 set -x,把执行的内容输出来;执行出错时结束程序,就像其他语言中的“抛出异常”一样。 带上shellcheck,有点不好安装 变量展开,玩转Bash变量 注意local,变... 阅读全文
posted @ 2016-11-08 23:46 Life·Intelligence 阅读(331) 评论(0) 推荐(0)
摘要: 知乎的一个专栏:超有机体 太有意思了,想我所想,而且作者算是专业出身,要多多学习。 阅读全文
posted @ 2016-11-07 15:03 Life·Intelligence 阅读(261) 评论(0) 推荐(0)
摘要: 参考: 8天学通MongoDB——第一天 基础入门 阅读全文
posted @ 2016-11-07 14:02 Life·Intelligence 阅读(143) 评论(0) 推荐(0)
摘要: 人工智能开始被资本炒的火热,但我还是比较悲观,计算机科学是勉强跟上了,但是智能的核心还是没有被揭示,其中脑科学和语言学等核心学科都没有突破性的进展。 制造真正的人工智能还得依赖仿生学,我们得观察自然智能,然后用我们现有的技术来努力实现。 那现在我们都观察到了什么呢? 个体与群体,语言不仅促成了个体的智能,还将个体联结成了群体,我们所说的智能往往默认是智能群体,因为个体是微不足道的。语言承载了信息的... 阅读全文
posted @ 2016-10-20 16:05 Life·Intelligence 阅读(283) 评论(0) 推荐(0)
摘要: 决定在python上有所突破 先看看知乎: 如何面试Python后端工程师? Python之美 - 知乎专栏 Python书籍推荐 阅读全文
posted @ 2016-10-20 12:08 Life·Intelligence 阅读(540) 评论(0) 推荐(0)
摘要: 虽然现在能在Linux系统下生存,但是自觉效率太低,和高手有很大的差距。 这就是关于Linux的知识太过匮乏,有很多事情知道该怎么做,但是就是没法在Linux下实现,为了提升工作效率,必须要接触Linux高级技巧 Linux的东西比较深,没法一下学完,所以只要能掌握生信必备的基础就好了。 一些主要的 阅读全文
posted @ 2016-10-20 11:08 Life·Intelligence 阅读(652) 评论(0) 推荐(0)
摘要: 之前学过perl,深知perl在模式匹配方面的强大,现在想完全转到python,虽说python的模式匹配没有perl那么强大,但还是可以用的,只是需要一个熟悉的过程。 参考资料: Python正则表达式指南 cnblog - 非常详细 阅读全文
posted @ 2016-10-20 11:03 Life·Intelligence 阅读(2043) 评论(0) 推荐(0)
摘要: python的一个核心优势就是模块多,有了模块你的编程工作就轻松了,不必从头开始造轮子,直接使用模块就能成为高手。 系统模块(sys) 操作系统接口模块(os) 数学模块(math) 正则匹配模块(re)参照:Python正则表达式指南 读文件模块(fileinput)参照:Python中fileinput模块介绍 读写压缩文件模块(gzip)参照:gzip — Suppo... 阅读全文
posted @ 2016-10-20 10:50 Life·Intelligence 阅读(549) 评论(0) 推荐(0)
摘要: sam格式很精炼,几乎包含了比对的所有信息,我们平常用到的信息很少,但特殊情况下,我们会用到一些较为生僻的信息,关于这些信息sam官方文档的介绍比较精简,直接看估计很难看懂。 今天要介绍的是如何通过bam文件统计比对的indel和mismatch信息 首先要介绍一个非常重要的概念--编辑距离 定义:从字符串a变到字符串b,所需要的最少的操作步骤(插入,删除,更改)为两个字符串之间的编辑距离。... 阅读全文
posted @ 2016-10-19 17:12 Life·Intelligence 阅读(3499) 评论(0) 推荐(0)
摘要: 视频地址: 《开讲啦》 20160910 颜宁:女科学家去哪儿了? 果然是女神科学家,讲了一些我很感兴趣的东西,让我也体会到了女神的气质,有点感触,这个节目不错,可以追。 颜宁教授于2016年5月中旬应央视之邀,在《开讲啦》节目中为我们描述了从结构生物学角度看到的世界,分享了她的科研经历和科研心得, 阅读全文
posted @ 2016-10-07 21:18 Life·Intelligence 阅读(1938) 评论(0) 推荐(0)
摘要: 2023年02月04日 现在又回头来处理fasta,读取可以用pysam,可以很省力,输出就用python,因为结构很简单。 import pysam all_fasta = pysam.FastaFile("all.human.protein.fasta") all_fasta.reference 阅读全文
posted @ 2016-09-26 12:58 Life·Intelligence 阅读(11326) 评论(0) 推荐(1)
摘要: 编程只有不断练习才能掌握其精髓,多练练网上的习题和项目,才能掌握python的精髓。 Python的模块和包是出了名的多,因此你不必自己从底层开始写起,只需要看懂模块和包的使用文档就可以了,因此掌握一些模块的基本使用方法是非常有必要的,举一反三,到最后无师自通。 参考链接: Python 的练手项目有哪些值得推荐? show-me-the-code 第 0000 题:将你的 QQ 头像(或... 阅读全文
posted @ 2016-09-10 21:57 Life·Intelligence 阅读(5561) 评论(0) 推荐(0)
摘要: 先不要想其他的,首先要在大脑里形成概念! 最大似然估计是什么意思?呵呵,完全不懂字面意思,似然是个啥啊?其实似然是likelihood的文言翻译,就是可能性的意思,所以Maximum Likelihood可以直接叫做最大可能性估计,这就好理解了,就是要求出最大的可能性(下的那个参数)。 一些最基本的概念:总体X,样本x,分布P(x;θ),随机变量(连续、离散),模型参数,联合分布,条件分布 ... 阅读全文
posted @ 2016-08-30 15:32 Life·Intelligence 阅读(1787) 评论(0) 推荐(0)
摘要: 看起来名字很陌生,但其实做机器学习的时候经常用到这个统计方法。 这个就是做回归时,用来拟合最优线性模型的方法。 参考链接: 最小二乘法 - CSDN 最小二乘法(又称最小平方法)是一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。最小二乘法还可用于曲线拟合。其他一些优化问题也可通过最小... 阅读全文
posted @ 2016-08-30 15:32 Life·Intelligence 阅读(1340) 评论(0) 推荐(0)
摘要: 看一个通俗的解释: HMM模型就是这样一个系统——它有一个会随时间改变的隐藏的状态,在持续地影响它的外在表现。 A tutorial on Hidden Markov Models and selected applications in Speech recognition python包: hm 阅读全文
posted @ 2016-08-30 15:28 Life·Intelligence 阅读(789) 评论(0) 推荐(0)
TOP