2018年9月13日
摘要:
1)enrichGO:(GO富集分析) 描述:GO Enrichment Analysis of a gene set. Given a vector of genes, this function will return the enrichment GO categories after FDR
阅读全文
posted @ 2018-09-13 10:08
发那个太丢人
阅读(954)
推荐(0)
2018年9月12日
摘要:
转自:http://www.biotrainee.com/thread-411-1-1.html 常用数据库 ID Ensembl stable IDs Ensembl stable ID 的结构是根据不同物种设置的前缀, 加上数据所指的类型, 如基因蛋白质, 再加上一系列的数字. 有的时候可以有不
阅读全文
posted @ 2018-09-12 19:49
发那个太丢人
阅读(1445)
推荐(0)
posted @ 2018-09-12 18:04
发那个太丢人
阅读(621)
推荐(1)
摘要:
这个包依赖极有可能是这个:https://www.kegg.jp/kegg/docs/keggapi.html ,如果可以看懂会很好理解 由于KEGG数据库分享数据的策略改变,因此KEGG.db包不在能用,推荐KEGGREST包 But a number of years ago,KEGG chan
阅读全文
posted @ 2018-09-12 15:01
发那个太丢人
阅读(9709)
推荐(0)
摘要:
1、KEGG简介 KEGG 数据库于 1995 年由 Kanehisa Laboratories 推出 0.1 版,目前发展为一个综合性数据库,其中最核心的为 KEGG PATHWAY 和 KEGG ORTHOLOGY 数据库。在 KEGG ORTHOLOGY 数据库中,将行使相同功能的基因聚在一起
阅读全文
posted @ 2018-09-12 11:13
发那个太丢人
阅读(9676)
推荐(1)
2018年9月11日
摘要:
前面我们讲过GO.db这个包,现在接着延伸topGO包,该包是用来协助GO富集分析 1)安装 2)使用方法 该包主要有三个使用步骤: 2.1、Data preparation:准备数据集,用于构建 topGOdata.对象。 2.1.1、包括gene标识符(List of genes identifi
阅读全文
posted @ 2018-09-11 09:59
发那个太丢人
阅读(2448)
推荐(0)
2018年9月10日
摘要:
相似的基因在不同物种中,其功能往往保守的。显然,需要一个统一的术语用于描述这些跨物种的同源基因及其基因产物的功能,否则,不同的实验室对相同的基因的功能的描述不同,将极大限制学术的交流。而 Gene Ontology (GO) 项目正是为了能够使对各种数据库中基因获基因产物功能描述相一致的努力结果。一
阅读全文
posted @ 2018-09-10 10:35
发那个太丢人
阅读(2368)
推荐(0)
摘要:
引用自https://mp.weixin.qq.com/s?__biz=MzU4NjU4ODQ2MQ==&mid=2247484662&idx=1&sn=194668553f954e231f4526f5c944a195&chksm=fdf84cb4ca8fc5a2c0e8355377f9d6abdc
阅读全文
posted @ 2018-09-10 09:08
发那个太丢人
阅读(1617)
推荐(0)
2018年9月9日
摘要:
1)安装载入 if("org.Hs.eg.db" %in% rownames(installed.packages()) == FALSE) {source("http://bioconductor.org/biocLite.R");biocLite("org.Hs.eg.db")}suppress
阅读全文
posted @ 2018-09-09 10:15
发那个太丢人
阅读(13425)
推荐(0)
2018年9月8日
摘要:
Bioconductor 1)简介Bioconductor项目始于2001年达纳法伯癌症研究所。 高科技产业多学科研究基金会为该项目提供支持。 2)目的Bioconductor项目的广泛目标是在计算生物学中实现良好的数据分析和推理实践,并提供一个平台,使科学家(生物学家和统计学家)能够开发和快速部署
阅读全文
posted @ 2018-09-08 21:33
发那个太丢人
阅读(294)
推荐(0)
2018年8月31日
摘要:
pip批量更新库 1)查看过期的库 pip list --outdated 更新单一的库: pip install --upgrade 库名 批量升级更新所有过期的库 import pipfrom pip._internal.utils.misc import get_installed_distr
阅读全文
posted @ 2018-08-31 10:57
发那个太丢人
阅读(198)
推荐(0)
2018年8月30日
摘要:
1)使用HMM模型搜索序列数据库(以青蟹蛋白库为例,简写为qingxie.pep),同源参考序列(query.fas)hmmbuild: 用多重比对序列构建HMM模型;hmmsearch: 使用HMM模型搜索序列库;步骤1: 1、pfam下载多重比对文件的种子序列(PF02898_seed_NOS.
阅读全文
posted @ 2018-08-30 10:53
发那个太丢人
阅读(3979)
推荐(0)
2018年8月29日
posted @ 2018-08-29 11:45
发那个太丢人
阅读(75)
推荐(0)
摘要:
1)下载各种数据bam、gtf、fasta、ded等的地址 ftp://ftp.ensembl.org/../pub/release-93/
阅读全文
posted @ 2018-08-29 10:21
发那个太丢人
阅读(1456)
推荐(0)
2018年8月28日
摘要:
1)背景处理基因组数据中,比较基因组不同区域,例如寻找overlap等,是一种基本的且常见的问题。虽然UCSC 中‘Table Browser’或者Galaxy可以用来处理,但是当这些工具面对大的数据的时候就会显得力不从心。因此,需要一款快速、灵活的软件来批量处理数据集。 bedtools是一款用C
阅读全文
posted @ 2018-08-28 11:36
发那个太丢人
阅读(3180)
推荐(0)
2018年8月27日
摘要:
1)samtools简介 背景:前面我们讲过sam/bam格式,sam文件虽然是可读的文本文件形式,但是通常是非常大,因此一般会对其压缩来节省磁盘空间,且对于很多软件来说,相比于对sam文件,对bam文件进行处理更加有效。SAMtools 是一款优秀的用以解析、处理sam/bam格式文件的一种软件包
阅读全文
posted @ 2018-08-27 10:37
发那个太丢人
阅读(1946)
推荐(0)
2018年8月21日
摘要:
1)plt.subplots() fig,ax = plt.subplots()的意思是,建立一个fig对象,建立一个axis对象。 pyplot有当前的图形(figure)和当前的轴(axes)的概念,所有的作图命令都是对当前的对象作用。 2)matplotlib各部分的讲解 首先一幅Matplo
阅读全文
posted @ 2018-08-21 17:24
发那个太丢人
阅读(178)
推荐(0)
摘要:
1)blast产生背景 双序列比对可以采用是基于动态规划算法的Needleman-Wunsch(NW)和Smith-Waterman algorithm(SW)算法,虽然精度高,但计算消耗大。当与数据库比对的时候,该算法就显得不切实际。因此TASTA,blast采用启发式算法使得通过大幅度丢失灵敏度
阅读全文
posted @ 2018-08-21 11:54
发那个太丢人
阅读(23817)
推荐(0)
2018年8月20日
posted @ 2018-08-20 11:51
发那个太丢人
阅读(185)
推荐(0)
2018年8月19日
posted @ 2018-08-19 15:39
发那个太丢人
阅读(108)
推荐(0)
摘要:
1)BED文件 BED 文件(Browser Extensible Data)格式是ucsc 的genome browser的一个格式 ,提供了一种灵活的方式来定义的数据行,以用来描述注释信息。BED行有3个必须的列和9个额外可选的列。每行的数据格式要求一致(见下图)。 每条线的字段数目必须是任意单
阅读全文
posted @ 2018-08-19 11:43
发那个太丢人
阅读(8211)
推荐(1)
2018年8月18日
摘要:
1)gff3及gtf2简介 一个物种的基因组测序完成后,需要对这些数据进行解读,首先要先找到这些序列中转录起始位点、基因、外显子、内含子等组成元件在染色体中的位置信息(即注释)后才能再进行深入的分析。gff/gtf是贮存这些注释信息的两种文件格式。 GFF(general feature forma
阅读全文
posted @ 2018-08-18 16:36
发那个太丢人
阅读(13846)
推荐(0)
2018年8月17日
摘要:
1)Sam (Sequence Alignment/Map) 1) SAM 文件产生背景 随着Illumina/Solexa, AB/SOLiD and Roche/454测序技术不断的进步,各种比对工具产生,被用来高效的将reads比对到参考基因组。因为这些比对工具产生不同格式的文件,导致下游分析
阅读全文
posted @ 2018-08-17 21:32
发那个太丢人
阅读(1814)
推荐(0)
摘要:
1)知识简介 1.1)测序质量值 首先在了解fastq,fasta之前,了解一下什么是质量值。phred软件在对reads进行base calling的时候会给出每一个碱基的质量值,这个质量值的计算与测序预期错误率相关(estimated probability of error): 除此之外还有s
阅读全文
posted @ 2018-08-17 16:16
发那个太丢人
阅读(11060)
推荐(0)
2018年8月16日
摘要:
1) 产生背景 2002年的时候,随着人类基因组项目不断推进,需要将大量ESTs(300万) 及mouse基因组的reads (130万)比对到人类基因组来进行注释,而这项任务需要在2周内完成 (90 CPU Linux 集群),因为blast工具速度相对偏慢,结果也不易处理,无法提供intron
阅读全文
posted @ 2018-08-16 21:51
发那个太丢人
阅读(1158)
推荐(0)
2018年8月14日
posted @ 2018-08-14 14:37
发那个太丢人
阅读(54)
推荐(0)
2018年8月8日
摘要:
1)下载http://freshmeat.sourceforge.net/projects/lrzsz/ 2)tar zxvf lrzsz-0.12.20.tar.gz 3)mv lrzsz-0.12.20/ lrzsz 4)./configure –prefix=/home/jxdong/bios
阅读全文
posted @ 2018-08-08 19:18
发那个太丢人
阅读(178)
推荐(0)
2018年8月3日
摘要:
1)数据集 data<-c(75.0,64.0,47.4,66.9,62.2,62.2,58.7,63.5,66.6,64.0,57.0,69.0,56.9,50.0,72.0) 默认是四分位:quantile(data) 求某个百分位:例如90% 求两个百分位:例如,10%,90% 产生一系列的等
阅读全文
posted @ 2018-08-03 16:18
发那个太丢人
阅读(619)
推荐(0)
摘要:
生成随机数有两个函数runif()和rnorm(),其中r表示的是random随机的意思,unif表示的是均匀分布,而norm表示的是正态分布。 1)生成10个2到3之间的,服从均匀分布的随机数:runif(10,2,3);服从正态分布的随机数:rnorm(10,2,3) 因为是随机的,所以每次的结
阅读全文
posted @ 2018-08-03 15:47
发那个太丢人
阅读(1715)
推荐(0)
2018年8月1日
摘要:
2.1 描述定性数据的图形法和数值法 定义2.1 类(或组)频数:落入这个类中的观测值的个数 类(或组)相对频率:落入这个类中的观测值的个数相对于观测值总数的比例 定性数据描述常用条形图和饼图 条形图:给出每一类的频数(或频率),长方形的高度或长度与类频数(或频率)成比例 饼图:一个整圆分成几份,每
阅读全文
posted @ 2018-08-01 20:57
发那个太丢人
阅读(364)
推荐(0)
2018年7月29日
摘要:
1.1 :统计学:数据的科学 定义1.1 统计学:是数据的科学,包括数据的收集、分类、概括、整理、分析以及解释。 统计学经常用于两种类型问题的解决: 1、概括,描述以及探索数据。(对应为描述性统计学) 2、利用样本数据推断被选取样本的数据集的性质。(对应为推断统计学) 定义1.2 描述性统计学:致力
阅读全文
posted @ 2018-07-29 22:57
发那个太丢人
阅读(738)
推荐(0)
2018年7月27日
摘要:
问题:刚安装的VIM中,backspace不能删除字符,且上下左右箭头没反应。 解决方法: sudo vi /etc/vim/vimrc.tiny 修改 set compatible为set nocompatible 设置是否兼容添加 set backspace=2 设置 backspace可以删除
阅读全文
posted @ 2018-07-27 16:52
发那个太丢人
阅读(111)
推荐(0)
2018年7月26日
摘要:
参考https://jingyan.baidu.com/article/3c48dd348bc005e10be358eb.html 1)下载最新版本地址:http://releases.ubuntu.com/18.04/ 2)下载并安装UltraISO软件,安装后插入U盘 3)然后打开软件,点击文件
阅读全文
posted @ 2018-07-26 16:53
发那个太丢人
阅读(172)
推荐(0)
摘要:
安装R引用自:https://www.howtoing.com/how-to-install-r-on-ubuntu-18-04 安装Rstudio引用自:https://www.rstudio.com/products/rstudio/download-server/ 由于R是一个快速移动的项目,
阅读全文
posted @ 2018-07-26 15:23
发那个太丢人
阅读(4948)
推荐(1)
摘要:
1)去https://www.anaconda.com/download/#download下载Anaconda安装文件(python3.6的版本)。 2)进入到Anaconda3-5.0.1-Linux-x86_64.sh文件所在的路径下,运行命令:sudo bash Anaconda3-5.0.
阅读全文
posted @ 2018-07-26 15:16
发那个太丢人
阅读(1474)
推荐(0)
2018年7月25日
摘要:
1) 从https://github.com/geeeeeeeeek/electronic-wechat/releases地址中下载 linux-x64.tar.gz文件到/opt/wechat文件夹 2) 然后解包到该文件夹: tar -zxvf ./electronic-wechat-linux
阅读全文
posted @ 2018-07-25 22:47
发那个太丢人
阅读(217)
推荐(0)
2018年7月18日
摘要:
引自:https://blog.csdn.net/lplj717/article/details/70053560 1xx - 信息提示这些状态代码表示临时的响应。客户端在收到常规响应之前,应准备接收一个或多个 1xx 响应。 · 100 - Continue 初始的请求已经接受,客户应当继续发送请
阅读全文
posted @ 2018-07-18 14:53
发那个太丢人
阅读(271)
推荐(0)
摘要:
引自https://www.cnblogs.com/ublue/articles/4471210.html 1、URL hash(片段标识符) 任一带#的URL称为片段URL(通常称为URL hash)。#左边部分是浏览器可以下载的资源,#右边部分称为片段标识符,表示资源内的某一位置。 举个例子:
阅读全文
posted @ 2018-07-18 14:37
发那个太丢人
阅读(283)
推荐(0)
2018年7月11日
摘要:
极大似然估计 以前多次接触过极大似然估计,但一直都不太明白到底什么原理,最近在看贝叶斯分类,对极大似然估计有了新的认识,总结如下: 贝叶斯决策 首先来看贝叶斯分类,我们都知道经典的贝叶斯公式: 其中:p(w):为先验概率,表示每种类别分布的概率;:类条件概率,表示在某种类别前提下,某事发生的概率;而
阅读全文
posted @ 2018-07-11 14:24
发那个太丢人
阅读(363)
推荐(0)
2018年7月8日
摘要:
一 :准备工作 1)中文的 LaTeX - CTEX 2)LaTeX 的*.tex 的编辑工具-Texmarker 3)TEXshade宏包 二:安装 1) 直接双击运行下载的CTEX,安装过程中,可以不安装Ghostscript、GSview和WinEdt三个组件 2)双击安装Texmaker,直
阅读全文
posted @ 2018-07-08 10:51
发那个太丢人
阅读(2048)
推荐(0)