随笔分类 - R语言
R语言
摘要:检验模型是否满足正态性假设的方法: 1.正态概率图 这是我编写的画正态概率图的函数: 若正态概率图近似呈一条直线,认为模型是符合正态性假设的。 2.QQ正态检验图 d是标准化残差 如果所有的点近似成直线,那么,残差就是正态分布的。 3.Shapiro正态性检验 Shapiro检验的原假设是:模型服从
阅读全文
摘要:R语言进行DW检验: DW检验的原假设为:误差不相关! 因为dw>0.05所以不拒绝原假设,即认为误差是不相关的。 误差自相关会产生的后果: 1.参数估计量仍然是线性的、无偏的,但非有效。 2.OLS估计量的被估方差是有偏的且会被低估,因而会使相应的t值变大。 3.模型的t和F统计检验失效。 4.用
阅读全文
摘要:显示西藏地区数据对应的cook统计量明显过大,不能放入建模分析中 进行正态性检验、残差分析 显示存在异方差 利用WLS修正异方差 人均教育经费数据WLS估计结果:
阅读全文
摘要:在高维数据分析过程中,为了筛选出与目标结局相关的变量,通常会用到回归分析,但是因为自变量较多,往往要进行多次回归。这就是统计编程语言发挥作用的时候了 有些大神们认为超过3次的复制粘贴就可以考虑使用循环了,当然个人“承受能力较强”,在分析过程中还是经常会用复制粘贴来解决相当一部分的问题。但是当变量太多
阅读全文
摘要:参考博客: http://blog.sina.com.cn/s/blog_8f5b2a2e0101fmiq.html https://blog.csdn.net/huangyouyu523/article/details/78565159
阅读全文
摘要:k = 16 #数据框的行数 z = data.frame( a = numeric(k), b = numeric(k), c = numeric(k), d = numeric(k) )
阅读全文
摘要:上图表明:外扩,方差不齐 inf列显示强影响点
阅读全文
摘要:BG:在box-cox变换中,当λ = 0时即为对数变换。 当所分析变量的标准差相对于均值而言比较大时,这种变换特别有用。对数据作对数变换常常起到降低数据波动性和减少不对称性的作用。。这一变换也能有效消除异方差性 effor 和 size 这两个变量的频率分布图表明,它们并不满足正态分布。为了接近正
阅读全文
摘要:求λ的第一种方法,用包 根据box-cox指令画出来的图,λ=0.5包含在区间中,于是令λ=0.5 求λ的第二种方法 (1)对给定的λ,计算z(λ) (2)求残差平方和 (3)对一系列的λ值,重复上述步骤,得到响应的残差平方和。以λ为横轴,残差平方和为纵轴,做出响应的曲线,值观看出使得残差平方和最小
阅读全文
摘要:1.scale() 函数 2.关于误差e的假设 假设中,e的方差为σ^2 σ^2 的估计为 mse mse = sse/(n-p) p为回归参数的个数 不能用scale函数直接求标准化残差,因为其对应的公式为 (e-mean(e)) / sqrt(sse/(n-1)) 而不是 n-p
阅读全文
摘要:从这个图看出残差随着N的增大而增大,因此似乎违背了方差齐性的假定。因为损害事故数可能是一个泊松分布,其方差与均值成比例。 由于可能是泊松分布,泊松分布的方差与均值有一次比例关系,所以为了保证方差齐性假定,我们做平方根变换。
阅读全文
摘要:Akaike information criterion,AIC是什么?一个用来筛选模型的指标。AIC越小模型越好,通常选择AIC最小的模型。第一句话好记,第二句话就呵呵了,小编有时候就会迷惑AIC越大越好还是越小越好。所以,还是要知其所以然的。 在AIC之前,我们需要知道Kullback–Leib
阅读全文
摘要:1.列表与向量 定义一个向量,然后向内添加元素,得到一个长向量列表: 定义一个列表,向内添加元素,则添加的元素会自动变为列表,最终得到的是一个元素为列表的列表 2.range R语言中没有range函数 ,若要循环:
阅读全文
摘要:方法一: Session -> Set Working Directory -> Choose Directory ... or shortcut (Ctrl+Shift+H) 方法二 setwd(“C:/ Users / burak / Desktop / R”)路径必须是英文,而且此法是一次性的
阅读全文
摘要:1. sd() 求一组数据的标准差 2.var() 求一组数据的方差 3.随机数与抽样模拟(正态分布、二项分布、指数分布。) https://blog.csdn.net/lilanfeng1991/article/details/18505723 rbinom(n,size,p) size表示每次进
阅读全文
摘要:y,X1,X2,X3 分别表示第 t 年各项税收收入(亿元),某国生产总值GDP(亿元),财政支出(亿元)和商品零售价格指数(%). (1) 建立线性模型: ① 自己编写函数: 所以各参数的估计值分别为 ② lm函数 于是各参数的估计值分别为 这两个方法的结果是一样的。 (2)要求实验报告中画出矩阵
阅读全文
摘要:1.加载 readxl 包,利用 reade_excel() 函数 read_excel函数的参数设置: 用法:read.xlsx(xlsxFile, sheet = 1, startRow = 1, colNames = TRUE, rowNames = FALSE, detectDates =
阅读全文
摘要:1.插入一列 根据自带数据集beaver 进行操作,比如插入一列id。 方法1: 方法2 方法3 2.插入一行 首先明确 beaver1 是输出整个数据框,beaver1[行范围,列范围]打印出指定范围的数据框。 3.按照条件提取数据 beavear1[行条件,列条件] 4.删除数据框数据 处理规则
阅读全文
摘要:创建一个列表变量,它的第一个元素包含所有从0到9的平方数,第二个元素为10到19之内的所有平方数,依此类推,最后一个元素为90到99之内的平方数。没有平方数的元素也应该被包含在内! 学习网友的解题思路,用的是apply()函数。 学习 apply() 函数: 1.apply函数的使用方法: 2.解题
阅读全文

浙公网安备 33010602011771号