摘要:
1、随机实验:可在相同2、随机事件均值u:这个很好理解 R函数:mean中位数:对序列排序后,排在中间的数,需要特别注意的是如果序列为偶数,中位数是中间两个数平均值. R函数:median百分位数:也是顺序统计量,设百分数为p,n是样本个数,则p位数指:np为小数,ceiling(np)+1,np为整数,则p位数:(x[np]+x[np+1])/2. R函数:quantile()方差s^2,标准差s:注意是除以n-1,而不是n.与方差期望的计算不一样.变异系数CV:s/u*100(%),s标准差,u均值.样本校正平方和(CSS):样本与均值差的平方的求和,sum((X-u)^2).样本未校正平 阅读全文
随笔分类 - R语言
R语言学习(概念理解2)
2012-07-26 19:09 by java线程例子, 320 阅读, 收藏,
摘要:
1、服从大数定律 如果当n足够大时,随机变量序列的算术平均值Y等于Y的期望地概率为1。 满足这个条件就可以说这个随机序列服从大数定律。2、Bernoulli大数定律 事件A的概率为p,当实验次数n足够大时,事件A出现的次数与n的比值等于p的概率为1,其实也就是说,但实验次数n足够大时,A出现的频率可以看作其出现的概率。 频率稳定于概率.3、Chebyshev(切比雪夫)大数定律 只要随机变量序列X(n)相互独立,且期望(u)和方差相同,在n足够大时,可以将序列的算术平均值看作是这个随机变量序列的数学期望u。4、Khintchin(辛钦)大数定律 如果随机变量序列X(n)服从相同的分布,且具有相 阅读全文
R语言矩阵运算
2012-07-22 21:33 by java线程例子, 549 阅读, 收藏,
摘要:
R语言矩阵运算 主要包括以下内容:创建矩阵向量;矩阵加减,乘积;矩阵的逆;行列式的值;特征值与特征向量;QR分解;奇异值分解;广义逆;backsolve与fowardsolve函数;取矩阵的上下三角元素;向量化算子等. 1 创建一个向量在R中可以用函数c()来创建一个向量,例如:> x=c(1,2,3,4)> x[1] 1 2 3 4 2 创建一个矩阵在R中可以用函数matrix()来创建一个矩阵,应用该函数时需要输入必要的参数值。> args(matrix)function (data = NA, nrow = 1, ncol = 1, byrow = FALSE, dim 阅读全文
对淬火算法,神经网络和遗传算法等算法的一点思考(欢迎探讨)
2012-07-19 22:37 by java线程例子, 334 阅读, 收藏,
摘要:
这些算法看起来有点瞎猜的味道,但实际上我觉得都做了如下假设:1)因变量和自变量之间存在一定的函数关系;2) 自变量对因变量的影响是连续的.其实这种假设包含的是经典时空理论下的运动假设,即:运动是有轨迹的,或者说运动是连续的,体现在前面的函数关系上,就是自变量的微小变化引起的自变量变化也是微小的(极限理论).虽然在很多时候,我们观察的结果看起来是不连续的,比如量子力学中的电子运动,但我们还是假定这种不连续是因为我们观察的维度太低所致.因为只有在这种思想下,才会有收敛和逼近这一说.但运动的本质是否就是这样呢?这个其实很难回答.但如果运动本身是不确定的或者说不连续的,那么这个世界将无法想象.至少在这 阅读全文
R语言学习系列(数据挖掘之决策树算法实现--ID3代码篇)
2012-07-18 21:26 by java线程例子, 731 阅读, 收藏,
摘要:
1、辅助类,用于计算过程和结果存储/// <summary> /// 决策树节点. /// </summary> public class DecisionTreeNode { /// <summary> /// 类型:分支或叶子 /// </summary> public string Type { get; set; } /// <summary> /// 关键字一般存当前属性因子 /// </summary> public string Key { ge... 阅读全文
R语言系列学习(各种检验)
2012-06-20 15:23 by java线程例子, 560 阅读, 收藏,
摘要:
1、W检验(Shapiro–Wilk (夏皮罗–威克尔 ) W统计量检验) 检验数据是否符合正态分布,R函数:shapiro.test(). 结果含义:当p值小于某个显著性水平α(比如0.05)时,则认为 样本不是来自正态分布的总体,否则则承认样本来自正态分布的总体。2、K检验(经验分布的Kolmogorov-Smirnov检验) R函数:ks.test(),如果P值很小,说明拒绝原假设,表明数据不符合F(n,m)分布。3、相关性检验: R函数:cor.test()cor.test(x, y,alternative = c("two.sided", "less&q 阅读全文
R语言学习系列(来点实际的分析样例)
2012-06-20 11:22 by java线程例子, 272 阅读, 收藏,
摘要:
这是我辛辛苦苦搞来的数据,说明一下,国内生产总值来至于国家统计局(2011年除外),M2来自网络。首先画散点图:图什么意思,你懂的。对M2和年份做拟合,当然是指数级的(从散点图可以看出)> lm.sol<-lm(log(M2)~年份,data=DT)> summary(lm.sol)Call:lm(formula = log(M2) ~ 年份, data = DT)Residuals: Min 1Q Median 3Q Max -0.04702 -0.03278 -0.020270.035910.06410 Coefficients: Estimate Std. Error 阅读全文
R语言学习系列(极大似然法)
2012-05-23 21:19 by java线程例子, 580 阅读, 收藏,
摘要:
第4章看得确实比较费劲,主要还是栽倒数学功底上了,极限求值,微分等东西早还给老师了,所以理解起来很困难。后来补了点高数,总算搞明白了。似然函数其实就是密度函数的变量常量化,参数变量化,然后求极大值点下的参数值作为参数估计值(前提当然是必须有极大值存在,连续,一阶导存在),因此需要对似然函数求一阶导,得出似然方程或者对数似然方程。对于一个参数的求起来比较容易,对于两个参数的,需要先固定一个参数变量求另外一个参数变量的一阶导,这样就得到两个似然方程或对数似然方程。正态分布的u,s^2估计就是这样计算得出的。对于有些似然函数需要用到复合求导,就有些复杂。R语言本身并不难,难的是背后的数学,出来工作这 阅读全文
R语言学习系列(画向量的密度直方图)
2012-05-18 21:18 by java线程例子, 955 阅读, 收藏,
摘要:
利用R语言画密度直方图比较方便,但为了理解密度函数的意义和如何计算密度值,于是用plot,lines两个画图函数来自己实现密度直方图的画图程序脚本如下:DrawDensity = function(x,bw=5){ if(any(bw<=0)) { bw <- 5 } #print(bw) n <- length(x) if(any(n>0)) { mn <- min(x) mx <- max(x) rmn <- (mn %/% bw) begx <- rmn * bw rmn <- (mx %/% bw) ... 阅读全文
R语言学习系列(概念理解1)
2012-05-14 16:18 by java线程例子, 277 阅读, 收藏,
摘要:
统计分析一般是针对批量数据,如何反映这批数据的特征,是做数据分析的根本目的,对于这些目标数据集合而言,类型其实是没有限制的,但为了能进行更好的分析,特别是利用数学的方法进行,一般都会将这些数据数字化和量化.因此一般情况下,我们统计分析的指标都可以定在数量上.那如何刻画这些数据的特征呢?平均值: 这是最简单的一个指标,这个指标反映的是数据的平均水平或能力,其优点是简单易算,但缺点也很明显,一是不能反映数据的分布情况,二是真实度不高,很容易受到干扰数据的影响.一个典型的例子就是1个1000W,9个穷光蛋,平均下来各个都是王百万.极值与极差:从极大值和极小值,我们可以看出数据的取值范围,也能反映数据 阅读全文