随笔分类 -  R语言

R语言
摘要:检验模型是否满足正态性假设的方法: 1.正态概率图 这是我编写的画正态概率图的函数: 若正态概率图近似呈一条直线,认为模型是符合正态性假设的。 2.QQ正态检验图 d是标准化残差 如果所有的点近似成直线,那么,残差就是正态分布的。 3.Shapiro正态性检验 Shapiro检验的原假设是:模型服从 阅读全文
posted @ 2019-10-29 21:19 从前有座山,山上 阅读(4158) 评论(0) 推荐(0)
摘要:R语言进行DW检验: DW检验的原假设为:误差不相关! 因为dw>0.05所以不拒绝原假设,即认为误差是不相关的。 误差自相关会产生的后果: 1.参数估计量仍然是线性的、无偏的,但非有效。 2.OLS估计量的被估方差是有偏的且会被低估,因而会使相应的t值变大。 3.模型的t和F统计检验失效。 4.用 阅读全文
posted @ 2019-10-29 21:03 从前有座山,山上 阅读(10855) 评论(0) 推荐(0)
摘要:显示西藏地区数据对应的cook统计量明显过大,不能放入建模分析中 进行正态性检验、残差分析 显示存在异方差 利用WLS修正异方差 人均教育经费数据WLS估计结果: 阅读全文
posted @ 2019-10-29 13:09 从前有座山,山上 阅读(1083) 评论(0) 推荐(0)
摘要:在高维数据分析过程中,为了筛选出与目标结局相关的变量,通常会用到回归分析,但是因为自变量较多,往往要进行多次回归。这就是统计编程语言发挥作用的时候了 有些大神们认为超过3次的复制粘贴就可以考虑使用循环了,当然个人“承受能力较强”,在分析过程中还是经常会用复制粘贴来解决相当一部分的问题。但是当变量太多 阅读全文
posted @ 2019-10-24 23:22 从前有座山,山上 阅读(18290) 评论(3) 推荐(0)
摘要:参考博客: http://blog.sina.com.cn/s/blog_8f5b2a2e0101fmiq.html https://blog.csdn.net/huangyouyu523/article/details/78565159 阅读全文
posted @ 2019-10-24 12:08 从前有座山,山上 阅读(436) 评论(0) 推荐(0)
摘要:k = 16 #数据框的行数 z = data.frame( a = numeric(k), b = numeric(k), c = numeric(k), d = numeric(k) ) 阅读全文
posted @ 2019-10-24 11:56 从前有座山,山上 阅读(4399) 评论(0) 推荐(0)
摘要:上图表明:外扩,方差不齐 inf列显示强影响点 阅读全文
posted @ 2019-10-23 01:13 从前有座山,山上 阅读(659) 评论(0) 推荐(0)
摘要:其他文章用的有自己编的,一起放到这里 阅读全文
posted @ 2019-10-23 00:41 从前有座山,山上 阅读(341) 评论(0) 推荐(0)
摘要:BG:在box-cox变换中,当λ = 0时即为对数变换。 当所分析变量的标准差相对于均值而言比较大时,这种变换特别有用。对数据作对数变换常常起到降低数据波动性和减少不对称性的作用。。这一变换也能有效消除异方差性 effor 和 size 这两个变量的频率分布图表明,它们并不满足正态分布。为了接近正 阅读全文
posted @ 2019-10-22 13:10 从前有座山,山上 阅读(2950) 评论(0) 推荐(0)
摘要:求λ的第一种方法,用包 根据box-cox指令画出来的图,λ=0.5包含在区间中,于是令λ=0.5 求λ的第二种方法 (1)对给定的λ,计算z(λ) (2)求残差平方和 (3)对一系列的λ值,重复上述步骤,得到响应的残差平方和。以λ为横轴,残差平方和为纵轴,做出响应的曲线,值观看出使得残差平方和最小 阅读全文
posted @ 2019-10-22 12:23 从前有座山,山上 阅读(1966) 评论(0) 推荐(0)
摘要:1.scale() 函数 2.关于误差e的假设 假设中,e的方差为σ^2 σ^2 的估计为 mse mse = sse/(n-p) p为回归参数的个数 不能用scale函数直接求标准化残差,因为其对应的公式为 (e-mean(e)) / sqrt(sse/(n-1)) 而不是 n-p 阅读全文
posted @ 2019-10-22 11:37 从前有座山,山上 阅读(2718) 评论(0) 推荐(0)
摘要:从这个图看出残差随着N的增大而增大,因此似乎违背了方差齐性的假定。因为损害事故数可能是一个泊松分布,其方差与均值成比例。 由于可能是泊松分布,泊松分布的方差与均值有一次比例关系,所以为了保证方差齐性假定,我们做平方根变换。 阅读全文
posted @ 2019-10-22 10:55 从前有座山,山上 阅读(2013) 评论(0) 推荐(0)
摘要:Akaike information criterion,AIC是什么?一个用来筛选模型的指标。AIC越小模型越好,通常选择AIC最小的模型。第一句话好记,第二句话就呵呵了,小编有时候就会迷惑AIC越大越好还是越小越好。所以,还是要知其所以然的。 在AIC之前,我们需要知道Kullback–Leib 阅读全文
posted @ 2019-10-22 10:19 从前有座山,山上 阅读(19060) 评论(0) 推荐(2)
摘要:1.列表与向量 定义一个向量,然后向内添加元素,得到一个长向量列表: 定义一个列表,向内添加元素,则添加的元素会自动变为列表,最终得到的是一个元素为列表的列表 2.range R语言中没有range函数 ,若要循环: 阅读全文
posted @ 2019-10-18 19:28 从前有座山,山上 阅读(283) 评论(0) 推荐(0)
摘要:方法一: Session -> Set Working Directory -> Choose Directory ... or shortcut (Ctrl+Shift+H) 方法二 setwd(“C:/ Users / burak / Desktop / R”)路径必须是英文,而且此法是一次性的 阅读全文
posted @ 2019-09-28 18:03 从前有座山,山上 阅读(2307) 评论(0) 推荐(0)
摘要:1. sd() 求一组数据的标准差 2.var() 求一组数据的方差 3.随机数与抽样模拟(正态分布、二项分布、指数分布。) https://blog.csdn.net/lilanfeng1991/article/details/18505723 rbinom(n,size,p) size表示每次进 阅读全文
posted @ 2019-09-23 14:05 从前有座山,山上 阅读(399) 评论(0) 推荐(0)
摘要:y,X1,X2,X3 分别表示第 t 年各项税收收入(亿元),某国生产总值GDP(亿元),财政支出(亿元)和商品零售价格指数(%). (1) 建立线性模型: ① 自己编写函数: 所以各参数的估计值分别为 ② lm函数 于是各参数的估计值分别为 这两个方法的结果是一样的。 (2)要求实验报告中画出矩阵 阅读全文
posted @ 2019-09-18 00:41 从前有座山,山上 阅读(6771) 评论(0) 推荐(0)
摘要:1.加载 readxl 包,利用 reade_excel() 函数 read_excel函数的参数设置: 用法:read.xlsx(xlsxFile, sheet = 1, startRow = 1, colNames = TRUE, rowNames = FALSE, detectDates = 阅读全文
posted @ 2019-09-15 00:45 从前有座山,山上 阅读(26861) 评论(0) 推荐(0)
摘要:1.插入一列 根据自带数据集beaver 进行操作,比如插入一列id。 方法1: 方法2 方法3 2.插入一行 首先明确 beaver1 是输出整个数据框,beaver1[行范围,列范围]打印出指定范围的数据框。 3.按照条件提取数据 beavear1[行条件,列条件] 4.删除数据框数据 处理规则 阅读全文
posted @ 2019-09-13 20:45 从前有座山,山上 阅读(681) 评论(0) 推荐(0)
摘要:创建一个列表变量,它的第一个元素包含所有从0到9的平方数,第二个元素为10到19之内的所有平方数,依此类推,最后一个元素为90到99之内的平方数。没有平方数的元素也应该被包含在内! 学习网友的解题思路,用的是apply()函数。 学习 apply() 函数: 1.apply函数的使用方法: 2.解题 阅读全文
posted @ 2019-09-13 18:28 从前有座山,山上 阅读(2351) 评论(0) 推荐(0)