05 2017 档案

摘要:本文转载自http://www.open-open.com/lib/view/open1342675735745.html 把用Python写好的脚本,可以用pyinstaller打包成.exe文件,方便发布,在其他电脑上脱离python语言环境而运行。1、要求: python3.5及以下版本,暂时 阅读全文
posted @ 2017-05-27 14:06 吴增丁 阅读(1591) 评论(0) 推荐(0)
摘要:在二代测序仪上测出的数据,通常都会表现出测序深度与GC 含量的相关性,称为GC bias。 GC bias校正 为了后续生物信息分析更加准确,通常需要做GC bias的校正。 2010 年 steven Quake 在Noninvasive diagnosis of fetal aneuploidy 阅读全文
posted @ 2017-05-25 15:32 吴增丁 阅读(6576) 评论(0) 推荐(0)
摘要:quenching有两种,学术上分为dynamic quenching 和static quenching,我们通常说的quenching就是 static quenching。 static quenching是因为dye的化学结构发生变化,这个dye已经死掉了(通俗点)...... dynami 阅读全文
posted @ 2017-05-24 10:46 吴增丁 阅读(1277) 评论(0) 推荐(0)
摘要:NIPT需要多大的数据量(reads number)? 调研 2014 Noninvasive prenatal diagnosis of common aneuploidies by semiconductor sequencing 报道 Approximately 65.5% (3.6 mill 阅读全文
posted @ 2017-05-24 10:32 吴增丁 阅读(1682) 评论(0) 推荐(0)
摘要:python的pip 安装 python有很多好用的包,但是需要的时候一一安装实在是麻烦,还好有pip这么好用的安装工具。所以第一步是安装pip,然后其它软件都so easy! 文章来源:https://packaging.python.org/installing/#id11 Requiremen 阅读全文
posted @ 2017-05-03 12:42 吴增丁 阅读(531) 评论(0) 推荐(0)
摘要:Python通过调用windows命令行处理sam文件 以samtools软件为例 一、下载或者索取得到windows版本的samtools软件,解压后如下: 进入文件内部,有如下几个文件: 二、将samtools设置环境变量: 上图是设置环境变量的窗口,建议在 系统变量里更改,这样即使变更用户名, 阅读全文
posted @ 2017-05-03 12:19 吴增丁 阅读(2559) 评论(0) 推荐(1)
摘要:Linux/Unix 指令使用说明的格式介绍(the Bash Command 'Usage' Syntax) 摘自 金马的Blog 原文 http://www.lijinma.com/blog/2014/08/24/bash-command-usage-syntax/ 此片文章是对自己的一个提醒! 阅读全文
posted @ 2017-05-03 12:14 吴增丁 阅读(773) 评论(0) 推荐(0)
摘要:Using the SRA Toolkit to convert .sra files into other formats Sequence Read Archive Submissions Staff. What is the purpose of the SRA toolkit? How do 阅读全文
posted @ 2017-05-03 12:13 吴增丁 阅读(5318) 评论(0) 推荐(0)
摘要:Sam&bam文件 SAM是一种序列比对格式标准, 由sanger制定,是以TAB为分割符的文本格式。主要应用于测序序列mapping到基因组上的结果表示,当然也可以表示任意的多重比对结果。当测序得到的fastq文件map到基因组之后,我们通常会得到一个sam或者bam为扩展名的文件。SAM的全称是 阅读全文
posted @ 2017-05-03 11:38 吴增丁 阅读(15093) 评论(0) 推荐(0)
摘要:fasta格式 在生物信息学中,FASTA格式(又称为Pearson格式),是一种基于文本用于表示核苷酸序列或氨基酸序列的格式。在这种格式中碱基对或氨基酸用单个字母来编码,且允许在序列前添加序列名及注释。 格式 序列文件的第一行是由大于号">"或分号";"打头的任意文字说明(习惯常用">"作为起始) 阅读全文
posted @ 2017-05-03 11:37 吴增丁 阅读(3282) 评论(0) 推荐(0)
摘要:Gff文件格式 gff格式是Sanger研究所定义,是一种简单的、方便的对于DNA、RNA以及蛋白质序列的特征进行描述的一种数据格式,已经成为序列注释的通用格式,比如基因组的基因预测,许多软件都支持输入或者输出gff格式。前格式定义的最新版本是版本3。原始定义见SONG websitegff是存文本 阅读全文
posted @ 2017-05-03 11:36 吴增丁 阅读(3249) 评论(0) 推荐(0)
摘要:fastQ格式 FASTQ是一种存储了生物序列(通常是核酸序列)以及相应的质量评价的文本格式. 他们都是以ASCII编码的。现在几乎是高通量测序的标准格式。NCBI Short Read Archive也是这格式,多了一些描述性词汇而已。 基本格式 包含四行,第一行由'@'开始,后面跟着序列的描述信 阅读全文
posted @ 2017-05-03 11:36 吴增丁 阅读(2588) 评论(0) 推荐(0)