上一页 1 ··· 6 7 8 9 10 11 12 13 14 ··· 17 下一页
摘要: 1 时序的平滑化和季节性分解 对时序数据建立复杂模型之前也需要对其进行描述和可视化。在本节中,我们将对时序进行平滑化以探究其总体趋势,并对其进行分解以观察时序中是否存在季节性因素。 1.1 通过简单移动平均进行平滑处理 时序数据集中通常有很显著的随机或误差成分。为了辨明数据中的规律,我们总是希望能够 阅读全文
posted @ 2021-08-13 16:39 zhang-X 阅读(3096) 评论(0) 推荐(0)
摘要: 时间序列 时间序列(简称时序),对时序数据的研究包括两个基本问题:对数据的描述(这段时间内发生了什么)以及预测(接下来将会发生什么)。对时间序列数据未来值进行预测是基本的人类活动,对时序数据的研究在现实世界中也有着广泛的应用。经济学家尝试通过时序分析理解并预测金融市场;城市规划者基于时序数据预测未来 阅读全文
posted @ 2021-08-13 16:33 zhang-X 阅读(1010) 评论(0) 推荐(0)
摘要: 因子分析 探索性因子分析(EFA)是一系列用来发现一组变量的潜在结构的方法。它通过寻找一组更小的、潜在的或隐藏的结构来解释已观测到的、显式的变量间的关系。例如,Harman74.cor包含了24个心理测验间的相互关系,受试对象为145个七年级或八年级的学生。假使应用EFA来探索该数据,结果表明276 阅读全文
posted @ 2021-08-13 16:30 zhang-X 阅读(2274) 评论(0) 推荐(0)
摘要: 主成分分析 主成分分析(PCA)是一种数据降维技巧,它能将大量相关变量转化为一组很少的不相关变量,这些无关变量称为主成分。例如,使用PCA可将30个相关(很可能冗余)的环境变量转化为5个无关的成分变量,并且尽可能地保留原始数据集的信息。 1 R中的主成分和因子分析 R的基础安装包提供了PCA和EFA 阅读全文
posted @ 2021-08-13 16:19 zhang-X 阅读(2732) 评论(0) 推荐(0)
摘要: 泊松回归 当通过一系列连续型和/或类别型预测变量来预测计数型结果变量时,泊松回归是一个非常有用的工具。为阐述泊松回归模型的拟合过程,并探讨一些可能出现的问题,我们将使用robust包中的Breslow癫痫数据(Breslow,1993)。特别地,我们将讨论在治疗初期的八周内,抗癫痫药物对癫痫发病数的 阅读全文
posted @ 2021-08-13 16:13 zhang-X 阅读(1497) 评论(0) 推荐(0)
摘要: 1 广义线性模型和 glm()函数 广义线性模型扩展了线性模型的框架,它包含了非正态因变量的分析。重点关注该框架中两种流行的模型:Logistic回归(因变量为类别型),比如多分类变量(比如差/良好/优秀)和泊松回归(因变量为计数型),比如一周交通事故的数目,每日酒水消耗的数量。 1.1 glm() 阅读全文
posted @ 2021-08-13 16:04 zhang-X 阅读(4981) 评论(0) 推荐(0)
摘要: 1 自助法 所谓自助法,即从初始样本重复随机替换抽样,生成一个或一系列待检验统计量的经验分布。 无需假设一个特定的理论分布,便可生成统计量的置信区间,并能检验统计假设。倘若你假设均值的样本分布不是正态分布,该怎么办呢?可使用自助法。 (1) 从样本中随机选择10个观测,抽样后再放回。有些观测可能会被 阅读全文
posted @ 2021-08-10 20:10 zhang-X 阅读(3003) 评论(0) 推荐(0)
摘要: 1 lmPerm 包的置换检验 lmPerm包可做线性模型的置换检验。比如lmp()和aovp()函数即lm()和aov()函数的修改版,能够进行置换检验,而非正态理论检验。lmp()和aovp()函数的参数与lm()和aov()函数类似,只额外添加了perm=参数。perm=选项的可选值有Exac 阅读全文
posted @ 2021-08-10 20:07 zhang-X 阅读(1677) 评论(0) 推荐(0)
摘要: 1 置换检验 置换方法和参数方法都计算了相同的t统计量。但置换方法并不是将统计量与理论分布进行比较,而是将其与置换观测数据后获得的经验分布进行比较,根据统计量值的极端性判断 是否有足够的理由拒绝零假设。 R目前有一些非常全面而复杂的软件包可以用来做置换检验。两个有用的包:coin和lmPerm包,c 阅读全文
posted @ 2021-08-10 20:02 zhang-X 阅读(1815) 评论(0) 推荐(0)
摘要: 1 马赛克图 我们已经学习了许多可视化定量或连续型变量间关系的方法。但如果变量是类别型的呢?若只观察单个类别型变量,可以使用柱状图或者饼图;但若有两个以上的类别型变量,该怎么办呢?一种办法是绘制马赛克图(mosaic plot)。在马赛克图中,嵌套矩形面积正比于单元格频率,其中该频率即多维列联表中的 阅读全文
posted @ 2021-08-10 16:42 zhang-X 阅读(828) 评论(0) 推荐(0)
上一页 1 ··· 6 7 8 9 10 11 12 13 14 ··· 17 下一页