摘要:安装 Flexbar "Flexbar" "github flexbar" 下载 $ wget http://downloads.sourceforge.net/project/flexbar/2.5/flexbar_v2.5_linux64.tgz 解压 $ tar...
阅读全文
摘要:安装 SAMStat "SAMStat" 下载 $ wget http://downloads.sourceforge.net/project/samstat/samstat 1.5.tar.gz 解压 $ tar xzvf samstat 1.5.tar.gz 编译 由...
阅读全文
摘要:安装 Picard "picard" 下载 $ wget https://github.com/broadinstitute/picard/releases/download/1.124/picard tools 1.124.zip O picard tools 1.124.zip
...
阅读全文
摘要:安装 FastQC "FastQC" 下载 $ wget http://www.bioinformatics.babraham.ac.uk/projects/fastqc/fastqc_v0.11.3.zip 解压 $ unzip fastqc_v0.11.3.zip 设置...
阅读全文
摘要:htseq count 的安装 "HTSeq: Analysing high throughput sequencing data with Python" "Prequisites and installation" 安装依赖的组件 $ sudo apt get install...
阅读全文
摘要:STAR 的安装 "github STAR" 下载 $ wget https://github.com/alexdobin/STAR/archive/STAR_2.4.2a.tar.gz 解压 $ tar xzf STAR_2.4.2a.tar.gz 编译安装 $...
阅读全文
摘要:安装 cufflinks2 "Cufflinks" "github cufflinks" 下载最新预编译版本 $ wget http://cole trapnell lab.github.io/cufflinks/assets/downloads/cufflinks 2.2.1...
阅读全文
摘要:安装 TopHat2 下载最新预编译版本 $ wget http://ccb.jhu.edu/software/tophat/downloads/tophat 2.1.0.Linux_x86_64.tar.gz 解压 $ tar zxvf tophat 2.1.0.Linux_x...
阅读全文
摘要:安装 bam readcount "bam readcount" 需要提前安装 git 和 cmake
如果都没有安装的话,可以一条命令: $ sudo apt get install build essential git core cmake zlib1g dev libncur...
阅读全文
摘要:主要介绍一下 SAMtools 的用法。它被誉为 NGS 里面的 瑞士军刀,功能很是强大,所以值得好好学习一番。 文档参考 "总站" "samtools mannual" "github samtools" "标准流程" 推荐: "blog SAMtools: ...
阅读全文
摘要:主要简述 bowtie 的入门用法,完成从原始序列到最后mapping 之后的 sam格式文件。 参考文档
最重要的参考文档还是官方文档: "Bowtie mannual" "Getting started with Bowtie" "github bowtie" ...
阅读全文
摘要:主要简述 bowtie2 的入门用法,完成从原始序列到最后完成mapping 之后的 sam格式文件。 参考文档
最重要的参考文档还是官方文档: "Bowtie2 mannual" "Getting started with Bowtie 2" "文献: Fast gap...
阅读全文
摘要:本文主要非常简要地介绍一下 基因组二代测序序列比对程序 BWA 的使用: 帮助文档 "Manual Reference Pages" "github bwa" "文献: Fast and accurate short read alignment with Burrows Wh...
阅读全文
摘要:主要介绍 awk 的用法, 是非常强大的一门语言,自然是很复杂, 入门级别先掌握基本的再说吧。主要还是从网上比较好的教程开始。 1. man awk man awk | less 2. The GNU Awk User’s Guide "The GNU Awk User’s Gu...
阅读全文
摘要:sed 命令也是非常有用,主要用来将数据进行选取, 替换, 删除, 新增等操作。 以下先列几个不错的网上教程: 1. man sed man sed | less 2. sed mannual "sed mannual" 3. sed introduction "sed...
阅读全文
摘要:本文是关于 grep 的一些用法,义为 globally search a regular expression and print ,功能很是强大,利用正则表达式来寻找 文本的 pattern,可以作为一个非常好的过滤器, 与其他工具结合使用可以达到使一些问题得到巧妙的解决。 grep 学习,...
阅读全文
摘要:正则表达式确实很强大,需要好好学习。但是其语法多样,完全涵盖的话需要一本书去讲解,作为入门级别,为了降低学习曲线以及提高自信心,打算先总结最常用的,最实用的,并且主要用于序列处理的一些知识点。 比较常用的符号 "标准库文档参考" "HOW TO" . In the default mode, ...
阅读全文
摘要:用 python 实现如下: 1 #!/usr/bin/python 2 # Complementing DNA 3 4 my_dna = "ACTGATCGATTACGTATAGTATTTGCTATCATACATATATATCGATGCGTTCAT" 5 # 由于python 区分大小写,所以先...
阅读全文
摘要:利用 dictionary 可以将给定的cDNA序列翻译成蛋白序列 1 #!/bin/python 2 # Dictionary protein translation 3 4 my_dna = open("/home/maque/my_dna.txt").read().replace('\n',...
阅读全文
摘要:习题来源: Python for Biologists: A complete programming course for beginner 1 #!/bin/python 2 # calculate the AT content of a DNA seq 3 4 def get_at_cont...
阅读全文
摘要:给定一个序列,寻找所有的E-BOX motif (CNNTTG) , 并且将其变为小写, 用 python 实现如下: 1 #!/bin/python 2 # Date: 2015.8.01 3 # Author: 4 """ Search E-box motif(CNNTTG) in a DNA...
阅读全文
摘要:手动寻找cripsr 引物比较麻烦,而现在有些网站可以完成这一任务,但是,用python 去实现它也很简单。以下是脚本: 1 #!/usr/bin/python 2 # list all crispr-target(20 bp + NGG) 3 4 import re 5 from Bio.Seq...
阅读全文
摘要:题目来源: Conditions and Loops 1 #!/usr/bin/python3 2 # sum all odds between two positive integer 3 4 a = int(input("Please input one positive integer > ...
阅读全文
摘要:在ubuntu 下下载安装软件使用不同的镜像源速度差异非常大, 官方的那个比较慢,所以选择最快的最有效率。设置方法不一,网上教程比较常见的是自己手动去更改更新源列表,把特定版本的源列表直接复制到 /etc/apt/sources.list 文件中,但是有时候源文件会失效,而且不一定每次源文件都是跟自...
阅读全文
摘要:有一个文件,内容如下 file_name1 file_name4 file_name3 file_name11 file_name7 file_name1 file_name3 file_name1 file_name8 文件里有重复的名字,现想去掉重复的,只保留一个,用 python 脚本实现,代...
阅读全文
摘要:本文主要介绍如何安装和使用 sra tools 这个软件,主要用途还是把NGS序列原始数据从 sra 格式转换到 fastq 格式,以便于后续的数据分析。 下载 "SRA Toolkit" 可以直接下载已经编译过的软件。无需自己再编译。 文档 安装,使用 "SRA Toolkit...
阅读全文
摘要:主要是关于 dictionary 的官方文档。总的来说, dict 这个类型不如其他类型那么灵活多变,用法比较固定,无论怎么变,基本上都是关于 key value 的。 标准库中的文档不算长,已经是简明厄要了,不需要再自己去挑选什么的,所以当前需要参考还是以该文档为主。 "Mapping Ty...
阅读全文
摘要:主要说一下在ubuntu 下如何安装最新版本的R以及 安装目前比较流行易用的IDE RStudio 下载 "下载镜像" 这个镜像在国内速度比较快,选择 Precompiled binary distributions, 后面安装会很简单。 安装R
安装直接点右键选择 open with...
阅读全文
摘要:ubuntu 下的 ibus 不是很好用,网上建议安装Fcitx 框架, 主要的网上教程如下: "Ubuntu 14.04 LTS中怎样安装fcitx中文输入法" "Ubuntu安装Fcitx(小企鹅五笔输入法)"
阅读全文
摘要:python有不同的序列类型,三个基本的为list, tuple, range; string 与 dictionary 单独去解析。 关于这一块,标准库的文档讲的非常好,没必要再贴过来 "Sequence Types — list, tuple, range" "Lists" "T...
阅读全文
摘要:因为用 python 主要还是集中在字符处理等上,所以有必要加深学习, 今天首先学习一下 string 的一些 方法,虽然也有 string 这个 module ,但是内置的 string.method 应该也挺丰富的,很多东西是重合的。并且由于 python 3.4 目前已经默认支持中文编码,而...
阅读全文