02 2014 档案

摘要:第一篇:从决策树学习谈到贝叶斯分类算法、EM、HMM (Machine Learning & Data Mining交流群:8986884)引言 最近在面试中,除了基础 & 算法 & 项目之外,经常被问到或被要求介绍和描述下自己所知道的几种分类或聚类算法(当然,这完全不代表... 阅读全文
posted @ 2014-02-28 09:33 hzs319 阅读(339) 评论(0) 推荐(0)
摘要:芯片质量分析芯片数据预处理获取差异表达基因GO和KEGG分析聚类分析(本文于2013.09.04更新)“差异”是个统计学概念,获取差异表达基因就要用统计方法,R的统计功能很强大,适合做这样的事情。 用前面的方法读取数据:library(affy)library(tcltk)filters 0subs... 阅读全文
posted @ 2014-02-24 20:33 hzs319 阅读(1501) 评论(0) 推荐(0)
摘要:芯片质量分析芯片数据预处理获取差异表达基因GO和KEGG分析聚类分析(本文于2013.09.04更新)基因芯片技术的特点是使用寡聚核苷酸探针检测基因。前一节使用ReadAffy函数读取CEL文件获得的数据是探针水平的(probe level),即杂交信号,而芯片数据预处理的目的是将杂交信号转成表达数... 阅读全文
posted @ 2014-02-24 10:17 hzs319 阅读(1600) 评论(0) 推荐(0)
摘要:在多元相关分析中,简单相关系数可能不能够真实的反映出变量X和Y之间的相关性,因为变量之间的关系很复杂,它们可能受到不止一个变量的影响。这个时候偏相关系数是一个更好的选择。偏相关系数是在排除了其他变量的影响下计算变量间的相关系数。假设我们需要计算X和Y之间的相关性,Z代表其他所有的变量,X和Y的偏相关... 阅读全文
posted @ 2014-02-19 09:24 hzs319 阅读(1225) 评论(0) 推荐(0)
摘要:基础ls()显示内存中的对象rm()删除内存中对象,rm(list=ls())删除全部?lm显示帮助help(lm)帮助getwd()获取当前工作目录setwd("C:/data")改变工作目录从外部文件中读取数据mydata=5] =5的值替换成20下标还可以是logical类型的FALSE或TR... 阅读全文
posted @ 2014-02-12 10:50 hzs319 阅读(284) 评论(0) 推荐(0)
摘要:I. 导论简单来讲,编程是借助计算机来解决某个问题。学习编程的就是训练我们解决问题的能力。有这样一种说法:在未来,不会编程的人即是文盲。1 为什么要学习R编程大部分情况下解决某些问题还需要依赖一些事实或数据,结合数据分析的框架和计算工具来帮助我们决策和判断。这时候R语言编程就会派上用场。例如从大的方... 阅读全文
posted @ 2014-02-12 10:49 hzs319 阅读(9378) 评论(0) 推荐(0)