摘要: Bioconductor的两个基础类:ExpressionSet类和SummarizedExpression类ExpressionSet类和SummarizedExpression类是储存高通量数据的两个基础类。ExpressionSet主要用于基于array的研究,它的row是feature,而S... 阅读全文
posted @ 2015-04-18 20:48 Nutastray 阅读(2465) 评论(0) 推荐(0)
摘要: PH525.4x第二周内容围绕GRange类的操作和使用Annotation进行数据关联两个主题展开,并展示了几个比较“炫”的功能。由于内容繁多,信息量大,故笔记之以便日后参考。该课程的演示数据为ChIP-seq的实验数据,背景为人类肝细胞(cell line:HepG2和GM12878)中被ESR... 阅读全文
posted @ 2015-04-11 00:16 Nutastray 阅读(1049) 评论(0) 推荐(0)
摘要: 谈到对高维度数据降维,SVD和PCA是最基本最常用的降维工具,在探索性数据分析中也有诸多妙用。SVD常常和PCA一同提起,至于他们之间的区别,哈佛在edX上的线上课PH525.3x Advanced Statistics for the Life Sciences有提到仅仅是去均值化的区别(PCA本... 阅读全文
posted @ 2015-03-22 21:48 Nutastray 阅读(320) 评论(0) 推荐(0)
摘要: 数据预处理假设6通道EEG(4通道EEG+2通道EOG),生成ndarray或矩阵S,row为time point,col为通道。对S进行标准化:S /= S.std(axis=0)ICA分析模块导入:from sklearn.decomposition import FastICA构建ICA对象,... 阅读全文
posted @ 2015-03-19 19:32 Nutastray 阅读(1070) 评论(0) 推荐(0)