摘要: python的pip 安装 python有很多好用的包,但是需要的时候一一安装实在是麻烦,还好有pip这么好用的安装工具。所以第一步是安装pip,然后其它软件都so easy! 文章来源:https://packaging.python.org/installing/#id11 Requiremen 阅读全文
posted @ 2017-05-03 12:42 吴增丁 阅读(482) 评论(0) 推荐(0) 编辑
摘要: Python通过调用windows命令行处理sam文件 以samtools软件为例 一、下载或者索取得到windows版本的samtools软件,解压后如下: 进入文件内部,有如下几个文件: 二、将samtools设置环境变量: 上图是设置环境变量的窗口,建议在 系统变量里更改,这样即使变更用户名, 阅读全文
posted @ 2017-05-03 12:19 吴增丁 阅读(2338) 评论(0) 推荐(1) 编辑
摘要: Linux/Unix 指令使用说明的格式介绍(the Bash Command 'Usage' Syntax) 摘自 金马的Blog 原文 http://www.lijinma.com/blog/2014/08/24/bash-command-usage-syntax/ 此片文章是对自己的一个提醒! 阅读全文
posted @ 2017-05-03 12:14 吴增丁 阅读(689) 评论(0) 推荐(0) 编辑
摘要: Using the SRA Toolkit to convert .sra files into other formats Sequence Read Archive Submissions Staff. What is the purpose of the SRA toolkit? How do 阅读全文
posted @ 2017-05-03 12:13 吴增丁 阅读(4983) 评论(0) 推荐(0) 编辑
摘要: Sam&bam文件 SAM是一种序列比对格式标准, 由sanger制定,是以TAB为分割符的文本格式。主要应用于测序序列mapping到基因组上的结果表示,当然也可以表示任意的多重比对结果。当测序得到的fastq文件map到基因组之后,我们通常会得到一个sam或者bam为扩展名的文件。SAM的全称是 阅读全文
posted @ 2017-05-03 11:38 吴增丁 阅读(14436) 评论(0) 推荐(0) 编辑
摘要: fasta格式 在生物信息学中,FASTA格式(又称为Pearson格式),是一种基于文本用于表示核苷酸序列或氨基酸序列的格式。在这种格式中碱基对或氨基酸用单个字母来编码,且允许在序列前添加序列名及注释。 格式 序列文件的第一行是由大于号">"或分号";"打头的任意文字说明(习惯常用">"作为起始) 阅读全文
posted @ 2017-05-03 11:37 吴增丁 阅读(1792) 评论(0) 推荐(0) 编辑
摘要: Gff文件格式 gff格式是Sanger研究所定义,是一种简单的、方便的对于DNA、RNA以及蛋白质序列的特征进行描述的一种数据格式,已经成为序列注释的通用格式,比如基因组的基因预测,许多软件都支持输入或者输出gff格式。前格式定义的最新版本是版本3。原始定义见SONG websitegff是存文本 阅读全文
posted @ 2017-05-03 11:36 吴增丁 阅读(2584) 评论(0) 推荐(0) 编辑
摘要: fastQ格式 FASTQ是一种存储了生物序列(通常是核酸序列)以及相应的质量评价的文本格式. 他们都是以ASCII编码的。现在几乎是高通量测序的标准格式。NCBI Short Read Archive也是这格式,多了一些描述性词汇而已。 基本格式 包含四行,第一行由'@'开始,后面跟着序列的描述信 阅读全文
posted @ 2017-05-03 11:36 吴增丁 阅读(2250) 评论(0) 推荐(0) 编辑