摘要: 近期,由于项目需求,需要用到贝叶斯定理及其相关知识,于是又系统的学习了一下,顺便做一下笔记。 参考资料: 概率论与数理统计的基础知识,这个PPT讲得非常通俗易懂,复习大学学过的知识 算法杂货铺——分类算法之朴素贝叶斯分类(Naive Bayesian classification) 理论讲的非常详细清楚 朴素贝叶斯的学习与分类 讲的非常精炼,代码用python实现得比较好 代码(非常详细的注... 阅读全文
posted @ 2016-08-30 11:00 Life·Intelligence 阅读(546) 评论(0) 推荐(0)
摘要: 参考链接:数据结构探险之图篇 阅读全文
posted @ 2016-08-24 00:06 Life·Intelligence 阅读(180) 评论(0) 推荐(0)
摘要: 参考链接:数据结构探险之树篇 阅读全文
posted @ 2016-08-24 00:05 Life·Intelligence 阅读(172) 评论(0) 推荐(0)
摘要: 参考链接:数据结构探险之线性表篇 线性表 阅读全文
posted @ 2016-08-23 23:48 Life·Intelligence 阅读(247) 评论(0) 推荐(0)
摘要: 参考链接:数据结构探险—栈篇 学了队列之后,栈就很简单了,换汤不换药。 栈 栈的模型 后进先出(电梯,进制转换,括号的匹配检测) 栈的基本元素 栈顶,栈底(一般很少用到),栈容量,栈长度 注意:栈顶一般指向栈最后一个元素的下一位 标准C++代码 //MyStack.h #pragma once class MyStack { public: M... 阅读全文
posted @ 2016-08-23 22:24 Life·Intelligence 阅读(632) 评论(0) 推荐(0)
摘要: 参考链接:数据结构探险—队列篇 数据结构太重要了,不学好是没法进行软件开发的。 C++写数据结构基本套路:一个.h文件写该数据结构类的接口;一个.cpp文件写接口的具体实现;一个main.cpp用于测试。 队列 队列的模型 想象一下现实生活中的队列,排队先入先出,不允许插队,队头先出,队尾进入。(应 阅读全文
posted @ 2016-08-23 15:47 Life·Intelligence 阅读(2299) 评论(0) 推荐(1)
摘要: 索引 1.统计fasta、fa和fastq文件的长度,统计fastq的reads个数,单个reads长度,reads总长度;统计fasta文件中contig的个数,列出名称,单条的长度,以及总长度。 2.1局部组装:创建目录,将比对好的reads按100k为单位,用samtools切,并用awk工具提起reads,分别存放在对应文件夹内 2.2局部组装:用得到的reads_name,去原始的下... 阅读全文
posted @ 2016-08-11 16:17 Life·Intelligence 阅读(5337) 评论(0) 推荐(0)
摘要: 学生信,Linux是最最基本的技能,要尽量将自己的工作平台转移到Linux,编程写脚本,这样会极大的提升工作效率,找工作时也不会太怂。Linux所有的任务都是通过命令来完成的,具有高度的统一性。Linux命令多,不可能都会,根据具体需求掌握部分即可。 awk文本处理利器,可以结合for进行批量处理。 阅读全文
posted @ 2016-08-11 11:04 Life·Intelligence 阅读(731) 评论(0) 推荐(0)
摘要: install Bio::SeqIO 或者直接perl -MCPAN -e 'install Excel::Writer::XLSX' 用cpan装不上,编译有问题,尝试用conda,成功安装。 然后还需要导出perllib,让perl能找到指定的pm包。 同时学perl、python和shell脚 阅读全文
posted @ 2016-08-10 01:39 Life·Intelligence 阅读(2435) 评论(0) 推荐(0)
摘要: Falcon Falcon: a set of tools for fast aligning long reads for consensus and assembly The Falcon tool kit is a set of simple code collection which I use for studying efficient assembly algorithm f... 阅读全文
posted @ 2016-08-01 09:23 Life·Intelligence 阅读(1759) 评论(0) 推荐(0)
摘要: 主页:github: PacificBiosciences/FALCON 简介 Falcon是一组通过快速比对长reads,从而来consensus和组装的工具。 Falcon工具包是一组简单的代码集合,我使用它们来研究单倍体和二倍体基因组的高效组装算法。 为了提高计算速度,它有一些后台代码是使用C来实现的,为了方便一些简单的前端是用Python编写的。 Falcon不是一... 阅读全文
posted @ 2016-08-01 09:10 Life·Intelligence 阅读(6036) 评论(0) 推荐(0)
摘要: 原文链接: http://blog.csdn.net/MoreWindows/article/category/859207 1.冒泡排序 核心思路: 双重循环 外层是进行多少轮,一轮冒泡只能排好一个数,所以有n轮;(这是最好的理解方式) 内层是单次冒泡,冒泡的核心是逐个,相邻元素两两比较,如此,一 阅读全文
posted @ 2016-07-31 15:23 Life·Intelligence 阅读(769) 评论(0) 推荐(0)
摘要: 转自:八大排序算法 - CSDN 概述 排序有内部排序和外部排序,内部排序是数据记录在内存中进行排序,而外部排序是因排序的数据很大,一次不能容纳全部的排序记录,在排序过程中需要访问外存。 我们这里说说八大排序就是内部排序。 当n较大,则应采用时间复杂度为O(nlog2n)的排序方法:快速排序、堆排序或归并排序序。 快速排序:是目前基于比较的内部排序中... 阅读全文
posted @ 2016-07-29 17:08 Life·Intelligence 阅读(1225) 评论(0) 推荐(0)
摘要: 来自:Poll的笔记 - 博客园 链接:http://www.cnblogs.com/maybe2030/p/4715035.html 阅读目录 1、顺序查找 2、二分查找 3、插值查找 4、斐波那契查找 5、树表查找 6、分块查找 7、哈希查找 查找是在大量的信息中寻找一个特定的信息元素,在计算机应用中,查找是常用的基本运算,例如编... 阅读全文
posted @ 2016-07-29 16:57 Life·Intelligence 阅读(54379) 评论(0) 推荐(5)
摘要: 转自:samtools常用命令详解 samtools的说明文档:http://samtools.sourceforge.net/samtools.shtml samtools是一个用于操作sam和bam文件的工具合集。包含有许多命令。以下是常用命令的介绍 1. view view命令的主要功能是:将sam文件转换成bam文件;然后对bam文件进行各种操作,比如数据的排序(不属于本命令的... 阅读全文
posted @ 2016-07-28 20:39 Life·Intelligence 阅读(1859) 评论(0) 推荐(0)
摘要: 链接:Canu Parameter Reference To get the most up-to-date options, run canu -options The default values below will vary based on the input data type and genome size.(根据输入数据类型和基因组大小决定默认参数) Global ... 阅读全文
posted @ 2016-07-28 00:49 Life·Intelligence 阅读(2261) 评论(0) 推荐(0)
摘要: 链接:Canu Tutorial Canu assembles reads from PacBio RS II or Oxford Nanopore MinION instruments into uniquely-assemblable contigs, unitigs. Canu owes lots of it design and code to celera-assembler. ... 阅读全文
posted @ 2016-07-27 23:56 Life·Intelligence 阅读(2799) 评论(0) 推荐(0)
摘要: 链接:Canu FAQ Q: What resources does Canu require for a bacterial genome assembly(细菌基因组组装)? A mammalian(哺乳类) assembly? A: Canu is designed to scale resources(自动测量系统硬件资源) to the system it r... 阅读全文
posted @ 2016-07-27 23:48 Life·Intelligence 阅读(1407) 评论(0) 推荐(0)
摘要: 参考:【干货】基因组组装你了解多少? -- 诺禾致源 动植物基因组de novo工作,其组装指标的好坏直接影响着整个基因组的质量。而评估基因组组装结果,contigN50和scaffoldN50是第一指标,即contig/ scaffoldN50:将contig/scaffold长度从长到短进行排序并累加,当累加和达到contig/scaffold总长度的50%的时候,最后参与加和的那一条... 阅读全文
posted @ 2016-07-27 13:45 Life·Intelligence 阅读(17742) 评论(0) 推荐(0)
摘要: Canu Quick Start Canu Quick Start PBcR (老版的canu) CA Canu specializes in(专门从事) assembling PacBio or Oxford Nanopre sequences. Canu will correct the reads, then trim suspicious regions(修剪可疑... 阅读全文
posted @ 2016-07-26 15:19 Life·Intelligence 阅读(4852) 评论(0) 推荐(0)
TOP