随笔分类 -  数据分析

提取矩阵中的多列
摘要:比如一个矩阵有10列,怎样才能提取其中的3 4 5 8 9列呢?ans:>> A = randn(2,10)A = Columns 1 through 8 -0.4326 0.1253 -1.1465 1.1892 0.3273 -0.1867 -0.5883 -0.1364 -1.6656 0.2877 1.1909 -0.0376 0.1746 0.7258 2.1832 0.1139 Columns 9 through 10 1.0668 -0.0956 0.0593 -0.8323>> A(:,[3:5,8,9])ans = -1.1465 1.1892 0.3 阅读全文

posted @ 2012-10-15 17:04 风也无踪 阅读(174) 评论(0) 推荐(0)

PCA和ICA
摘要:独立元分析(ICA)被看作是主元分析(PCA)的扩展。其差别在于:主元分析只利用了观察数据的二阶统计量且要求各分量正交,而独立元分析利用了观察数据的高阶统计量且要求各分量统计独立。对于高斯分布的信号,二阶统计量足以描述其特性,但是对于通信系统中典型的通信信号,其分布通常是欠高斯的,所以二阶统计 量不足以描述其特性,必须用高阶统计量描述其特性。 阅读全文

posted @ 2012-10-13 19:47 风也无踪 阅读(444) 评论(0) 推荐(0)

Data Mining的十种分析方法
摘要:Data Mining的十种分析方法:记忆基础推理法(Memory-Based Reasoning;MBR)记忆基础推理法最主要的概念是用已知的案例(case)来预测未来案例的一些属性(attribute),通常找寻最相似的案例来做比较。记 忆基础推理法中有两个主要的要素,分别为距离函数(distance function)与结合函数(combination function)。距离函数的用意在找出最相似的案例;结合函数则将相似案例的属性结合起来,以供预测之用。记忆基础推理法的优点是它容许各种型态的数 据,这些数据不需服从某些假设。另一个优点是其具备学习能力,它能藉由旧案例的学习来获取关于新案 阅读全文

posted @ 2012-09-17 10:33 风也无踪 阅读(346) 评论(0) 推荐(0)

数据挖掘工具weka中的算法列表
摘要:1) 数据输入和输出WOW():查看Weka函数的参数。Weka_control():设置Weka函数的参数。read.arff():读Weka Attribute-Relation File Format (ARFF)格式的数据。write.arff:将数据写入Weka Attribute-Relation File Format (ARFF)格式的文件。2) 数据预处理Normalize():无监督的标准化连续性数据。Discretize():用MDL(Minimum Description Length)方法,有监督的离散化连续性数值数据。3) 分类和回归IBk():k最近邻分类LBR( 阅读全文

posted @ 2012-09-17 10:30 风也无踪 阅读(609) 评论(0) 推荐(0)

spss数据标准化
摘要:数据标准化主要功能就是消除变量间的量纲关系,从而使数据具有可比性。只有通过数据标准化,都把它们转换到同一个标准时才具有可比性,一般标准化采用的是Z标准化,即均值为0,方差为1,当然也有其他标准化,比如0--1标准化等等 阅读全文

posted @ 2012-09-17 10:27 风也无踪 阅读(1285) 评论(0) 推荐(0)

数据分析-pca协方差
摘要:协方差是反映的变量之间的二阶统计特性,如果随机向量的不同分量之间的相关性很小,则所得的协方差矩阵几乎是一个对角矩阵。 阅读全文

posted @ 2012-09-08 21:03 风也无踪 阅读(193) 评论(0) 推荐(0)

导航