摘要: 在使用FastQC之后,如果我们发现了一些问题(序列质量不高),那么我们该使用什么样的工具,去解决这些问题呢? fastx Toolkit是包含处理fastq/fasta文件的一系列的工具,它是基于java开发的,我们高通量测序最常用到的是使用这个软件进行reads的裁剪(trim) FASTQ-t 阅读全文
posted @ 2017-08-03 17:47 弗雷赛斯 阅读(1093) 评论(1) 推荐(0) 编辑
摘要: 1、下载fastqc 2、解压 3、 给予执行权限,否则执行的时候会显示没有权限 cd FastQCchmod 755 fastqc 4、加入到PATH export PATH=/home/h/FastQC/:$PATH 4、加入到PATH 5、测试 fastqc --help 5、测试 使用例子 阅读全文
posted @ 2017-08-03 10:53 弗雷赛斯 阅读(4098) 评论(0) 推荐(0) 编辑
摘要: HISAT samtools HTSeq 阅读全文
posted @ 2017-08-03 02:05 弗雷赛斯 阅读(639) 评论(0) 推荐(0) 编辑
摘要: https://trace.ncbi.nlm.nih.gov/Traces/study/?acc=PRJNA323422 lne是perl的参数,效果是: perl接收你的键盘输入(用后面的代码)处理后,输出一个换行,然后等待接收下一个输入 perl -lne '$id=substr($_,0,6) 阅读全文
posted @ 2017-08-03 01:22 弗雷赛斯 阅读(765) 评论(0) 推荐(0) 编辑
摘要: 1.创建一个本地项目,比如/d/text文件夹 2.建立本地仓库 首先进入text文件夹 初始化执行指令: 将所有文件添加到仓库执行指令: 执行指令(双引号内是提交注释): git commit -m "提交文件" 执行指令(双引号内是提交注释): 3.关联github仓库 到github text 阅读全文
posted @ 2017-08-03 00:43 弗雷赛斯 阅读(227) 评论(0) 推荐(0) 编辑
摘要: 使用cbind()函数连接多个向量来创建数据帧。此外,使用rbind()函数合并两个数据帧 使用merge()函数合并两个数据帧。数据帧必须具有相同的列名称,在其上进行合并 melt()拆分数据和cast()数据重构 连接字符串 - paste()函数 格式化数字和字符串 - format()函数 阅读全文
posted @ 2017-08-03 00:33 弗雷赛斯 阅读(348) 评论(0) 推荐(0) 编辑
摘要: sratookit 下载后解压 移动到专门安装生物信息软件的目录下 加入环境变量 测试 下载测试文件SRR390728,默认存放在家目录下的ncbi文件夹中 转换sra文件的套路: -O 指定输出路径 --gzip 指定输出格式为gzip压缩格式(fastqc软件可以直接识别gzip压缩的文件) - 阅读全文
posted @ 2017-08-03 00:30 弗雷赛斯 阅读(430) 评论(0) 推荐(0) 编辑
摘要: 数据分析与解读 1. Data Cleaning 从原始数据(Raw Data)到干净数据(Clean Data)的过程,有人翻译成“数据清洗”,实在叫不习惯 Illumina测序仪下机的数据通常为Bcl格式,是将同一个测序通道(Lane)所有样品的数据混杂在一起的,所以公司一般不会提供Bcl文件。 阅读全文
posted @ 2017-08-03 00:29 弗雷赛斯 阅读(1376) 评论(0) 推荐(0) 编辑
摘要: 在单菌基因组的组装结果中,N50和N90代表什么意思? 大于N50长度的序列占基因组总长的50%,大于N90长度的序列占基因组总长的90%。 1、N50和N90是基因组组装中常用的组装指标,其含义为,将序列按照长度从大到小排列,依次计算大于该序列长度的序列总长,找到序列总长度刚好大于基因组总长度的5 阅读全文
posted @ 2017-08-03 00:17 弗雷赛斯 阅读(1567) 评论(0) 推荐(0) 编辑
摘要: 在微生物测序中,样本的准备从根本上是确保获得高质量DNA的前提,而样本准备也正是让众多微生物科研工作者感到困扰的重要一步。今天就给大家分类介绍一下常见的微生物样本类型及采样方法 微生物测序样本准备方法 医口样本类型 样本种类推荐生物学重复 肠道 粪便,粘膜 6, 推荐 10 液体 尿,血液,脑髓液, 阅读全文
posted @ 2017-08-03 00:14 弗雷赛斯 阅读(3625) 评论(0) 推荐(0) 编辑
摘要: Microbiota 微生物群 微生物群是指研究动植物体上共生或病理的微生物生态群体。微生物群包括细菌、古菌、原生动物、真菌和病毒。研究表明其在宿主的免疫、代谢和激素等方面非常重要。近义词Microbiome微生物组即包括微生物,又包括其基因组 Microbiota 微生物群 微生物群是指研究动植物 阅读全文
posted @ 2017-08-03 00:13 弗雷赛斯 阅读(873) 评论(0) 推荐(0) 编辑
摘要: 扩增子常见问题 01 实验室检测的DNA浓度很高,送到公司检测之后浓度却比较低呢? 1、老师在实验室多采用Nanodrop对DNA浓度进行检测,而在公司我们会结合Qubit、Nanodrop、琼脂糖电泳三种方法检测DNA样品的质量; 2、由于不同检测方法的原理不同,所以检测出的结果也会存在一定的差异 阅读全文
posted @ 2017-08-03 00:13 弗雷赛斯 阅读(5059) 评论(0) 推荐(0) 编辑
摘要: 网络图 Network 网络图虽然给人高大上的感觉,但是由于信息太多,无法给读者提供读有效的可读信息或是读者不知道该理解什么,总是让人望尔却步。那是因为大家太不了解网络,自己读不懂网络想表达的意思及其重要性。 因此我要举一个网络分析重要的例子,大家都知道2012年诺贝尔奖得主Yamanaka提出的诱 阅读全文
posted @ 2017-08-03 00:12 弗雷赛斯 阅读(4206) 评论(0) 推荐(0) 编辑
摘要: 三元图/三元相图 Ternary Plot 三元图有6种英文叫法,其中ternary plot最为常用。三元图是重心图的一种,它有三个变量,但需要三者总和为恒定值。在一个等边三角形坐标系中,图中某一点的位置代表三个变量间的比例关系。常用于物理化学、 岩石学、矿物学、冶金学和其它物理科学,用于表示在同 阅读全文
posted @ 2017-08-03 00:11 弗雷赛斯 阅读(5537) 评论(0) 推荐(0) 编辑
摘要: 火山图 Volcano plot 在统计学上,火山图是一种类型的散点图,被用于在大数据中快速鉴定变化。由于它的形成像火山喷发的样子,所以被称为火山图。和上文讲的曼哈顿图类似。 火山图基本元素 火山图也有很多种样式,在生物学高通量测序结果中,常见有的X和Y轴分别为aboundance 和 fold-c 阅读全文
posted @ 2017-08-03 00:10 弗雷赛斯 阅读(3815) 评论(0) 推荐(0) 编辑
摘要: 韦恩图 Venn Diagram Venn Diagram,也称韦恩图、维恩图、文氏图,用于显示元素集合重叠区域的图示。 韦图绘制工具 常用R语言的VennDiagram包绘制,输出PDF格式方便修改。此外还有非常多的在线工具,使用方便。详见“轻松绘制各种Venn图” 韦恩图在扩增子中用途 展示各样 阅读全文
posted @ 2017-08-03 00:10 弗雷赛斯 阅读(4768) 评论(0) 推荐(0) 编辑
摘要: 曼哈顿图 Manhattan Plot 曼哈顿图本质上是一个散点图,用于显示大量非零大范围波动数值,最早应用于全基因组关联分析(GWAS)研究展示高度相关位点。它得名源于样式与曼哈顿天际线相似(如下图)。 近几年,在宏基因组领域,尤其是差异OTU结合分类学结果,采用Manhattan plot展示有 阅读全文
posted @ 2017-08-03 00:09 弗雷赛斯 阅读(10244) 评论(0) 推荐(0) 编辑