摘要:
之前详细介绍了R语言中的主成分分析,以及超级详细的主成分分析可视化方法,主要是基于factoextra和factoMineR两个神包。 今天说一下如何提取数据用ggplot2画PCA图,以及三维PCA图。 提取数据 还是使用鸢尾花数据集。 rm(list = ls()) pca.res <- prc 阅读全文
posted @ 2023-03-28 13:50
医学和生信笔记
阅读(406)
评论(0)
推荐(0)
摘要:
网络上很多R语言教程都是基于R语言实战进行修改,今天为大家介绍更好用的R包,在之前聚类分析中也经常用到:factoextra和factoMineR,关于主成分分析的可视化,大家比较常见的可能是ggbiplot,这几个R包都挺不错,大家可以比较下。 之前已经多次用到了这两个R包: PCA 聚类 这两个 阅读全文
posted @ 2023-03-28 13:49
医学和生信笔记
阅读(397)
评论(0)
推荐(0)
摘要:
在医学研究中,为了客观、全面地分析问题,常要记录多个观察指标并考虑众多的影响因素,这样的 者,数据虽然可以提供丰富的信息,但同时也使得数据的分析工作更趋复杂化。 例如,在儿童生长发育的评价中,收集到的数据包括每一儿童的身高、体重、胸围、头围、坐高、肺活量等十多个指标。怎样利用这类多指标的数据对每一儿 阅读全文
posted @ 2023-03-28 13:49
医学和生信笔记
阅读(503)
评论(0)
推荐(0)
摘要:
因子分析可以看做是主成分分析的进一步扩展,主成分分析重点在综合原始变量的信息,而因子分析重在解释原始变量之间的关系。 主成分并没有实际的意义,只是原始变量的线性组合,但是因子有明确的意义,是可以解释的。 因子分析的步骤和主成分也是差不多的,关于因子分析前的一些准备工作可以参考之前主成分分析的步骤,比 阅读全文
posted @ 2023-03-28 13:49
医学和生信笔记
阅读(524)
评论(0)
推荐(0)
摘要:
样本量计算也是医学统计学中的一块重要内容,但是在课本中并没有详细介绍,今天我们说一下常见的研究设计的样本量计算。我使用的课本是孙振球主编的《医学统计学》第4版,封面如下: 通常样本量计算大家可能知道PASS软件,这是一个专门用来计算样本量的软件,但是也是付费的,并且没有mac版,而R语言免费,谁都可 阅读全文
posted @ 2023-03-28 13:49
医学和生信笔记
阅读(1168)
评论(0)
推荐(0)
摘要:
随机分组在临床设计中太常见了,只要你搞临床研究,必定会遇到随机分组的问题。 随机分组临床比较常用的也就是4种: 简单随机simple randomization 区组随机blocked randomization 分层随机stratified randomization 整群随机cluster ra 阅读全文
posted @ 2023-03-28 13:48
医学和生信笔记
阅读(769)
评论(0)
推荐(0)
摘要:
之前分别介绍了生存分析中的寿命表法、K-M曲线、logrank检验, 以及Cox回归的构建、可视化以及比例风险检验的内容, 并介绍了超级详细的生存曲线可视化, 本次主要介绍如果数据不符合PH假设时采取的方法。 时间依存协变量的Cox回归和时间依存系数Cox回归 关于时依协变量、时依系数的基础知识,大 阅读全文
posted @ 2023-03-28 13:48
医学和生信笔记
阅读(1013)
评论(0)
推荐(0)
摘要:
上次介绍了生存分析中的寿命表、K-M曲线、logrank检验、最佳切点的寻找等,本次主要介绍Cox回归。 本推文不涉及理论,只有实操,想要了解生存分析的理论的请自行学习。 Cox回归 使用survival包中的lung数据集用于演示,这是一份关于肺癌患者的生存数据。time是生存时间,以天为单位,s 阅读全文
posted @ 2023-03-28 13:47
医学和生信笔记
阅读(1162)
评论(0)
推荐(0)
摘要:
survminer是专门用来进行生存分析可视化的R包,主要函数如下: 生存曲线 ggsurvplot(): arrange_ggsurvplots(): ggsurvevents(): surv_summary(): surv_cutpoint(): pairwise_survdiff(): Cox 阅读全文
posted @ 2023-03-28 13:47
医学和生信笔记
阅读(756)
评论(0)
推荐(0)
摘要:
生存分析是临床常用统计方法,一旦和时间扯上关系,分析就变得复杂多了,此时不再是单一的因变量,还需要考虑时间给因变量和自变量带来的各种影响。 本次主要演示R语言做生存分析的一些方法。比如寿命表、K-M曲线、logrank检验。 本推文不涉及理论,只有实操,想要了解生存分析的理论的请自行学习。 生存过程 阅读全文
posted @ 2023-03-28 13:47
医学和生信笔记
阅读(984)
评论(0)
推荐(0)
摘要:
之前已经介绍过倾向性评分匹配(propensity score matching)、倾向性评分回归和分层, 今天继续介绍倾向性评分最后一个重要的部分:倾向性评分加权。 主要介绍两种加权方法:逆概率加权(inverse probability weighting, IPW)和重叠加权(overlap 阅读全文
posted @ 2023-03-28 13:46
医学和生信笔记
阅读(1503)
评论(0)
推荐(0)
摘要:
倾向性评分有4种应用,前面介绍了倾向性评分匹配及matchIt和cobalt包的使用:xxxxxxx 今天说一下倾向性评分回归和分层。使用了一个不是很成功的案例,并使用了大量purrr风格的代码实现。 演示数据 下面这个例子探讨不同学校对学生成绩的影响,这个数据一共有11078行,23列,我们只用其 阅读全文
posted @ 2023-03-28 13:46
医学和生信笔记
阅读(274)
评论(0)
推荐(0)
摘要:
倾向性评分(Propensity Score, PS)是一种控制混杂因素的统计学方法,通过倾向性评分的方法,可以把基线控制在可比的水平,这样就可以比较处理因素带来的差异了。 比如,现在要比较A,B两种方法治疗肥胖的效果,随机分两组,分别使用A,B两种方法半年,看哪个方法效果好。一般收集到的病人性别、 阅读全文
posted @ 2023-03-28 13:46
医学和生信笔记
阅读(1357)
评论(0)
推荐(0)
摘要:
使用R语言实现偏相关分析和典型相关分析,并画出偏相关的散点图。 关于偏相关和典型相关的具体含义和适用范围大家自己学习。 偏相关(partial correlation) 使用R包ppcor实现。 首先是加载数据和R包。 library(ppcor) ## Loading required packa 阅读全文
posted @ 2023-03-28 13:45
医学和生信笔记
阅读(544)
评论(0)
推荐(0)
摘要:
判别分析(discriminant analysis)是根据判别对象若干个指标的观测结果判定其属于哪一类的统计方法。经典的判别分析方法有Fisher判别和贝叶斯判别分析。当分类很确定时,判别分析可以有效替代logistic回归,但是如果自变量和因变量关系很复杂时,判别分析表现不如logistic回归 阅读全文
posted @ 2023-03-28 13:45
医学和生信笔记
阅读(241)
评论(0)
推荐(0)
摘要:
卡方检验/列联表资料的卡方检验在临床中非常常见! 因为最近又有一批临床数据要进行统计,所以趁机把卡方检验的R语言实现再重新梳理一遍。 这篇文章涵盖了孙振球,徐勇勇《医学统计学》第4版 卡方检验章节 中的 所有内容。课本电子版和配套数据已上传到QQ群,需要的朋友加群下载即可。 本期目录: 不同类型卡方 阅读全文
posted @ 2023-03-28 13:45
医学和生信笔记
阅读(355)
评论(0)
推荐(0)
摘要:
之前的推文使用默认的plot函数进行聚类树的可视化,今天继续扩展聚类树的可视化。 默认的聚类树可视化函数已经非常好用,有非常多的自定义设置,可以轻松实现好看的聚类树可视化。 op <- par(bg = "grey90") plot(h.clust, main = "层次聚类", sub="", x 阅读全文
posted @ 2023-03-28 13:44
医学和生信笔记
阅读(231)
评论(0)
推荐(0)
摘要:
主要介绍使用R语言进行层次聚类、划分聚类(K均值聚类和PAM)。 系统聚类(层次聚类,Hierarchical clustering) 使用nutrient数据集进行演示,这个数据集包含不同食物中的营养物质含量。 # 没安装flexclust包的需要先安装 data(nutrient, packag 阅读全文
posted @ 2023-03-28 13:44
医学和生信笔记
阅读(430)
评论(0)
推荐(0)
摘要:
R语言中的分类变量在进行回归分析时,通常会进行一些编码设置,最常见的是哑变量设置,除了哑变量,还有其他的很多类型。 **通常一个有K个类别的分类变量在进入回归分析时,会被自动编码成K-1个序列,然后会得到K-1个回归系数,这些回归系数对应着因变量根据K个类别分组后计算的平均值!**这样说起来非常抽象 阅读全文
posted @ 2023-03-28 13:44
医学和生信笔记
阅读(681)
评论(0)
推荐(0)
摘要:
R语言做方差分析很简单,就是一个函数aov(),包括但不限于单因素方差分析、多因素方差分析、协方差分析、重复测量方差分析等,都是这个函数。 前面用一篇推文详细介绍了R语言中方差分析的各种实现方法, R语言做方差分析和SPSS/SAS等传统统计软件不太一样,下面说一下需要注意的地方,主要是2个点: 3 阅读全文
posted @ 2023-03-28 13:43
医学和生信笔记
阅读(347)
评论(0)
推荐(0)
摘要:
介绍各种类型方差分析的R语言实现方法,目录如下: 这篇文章涵盖了孙振球,徐勇勇《医学统计学》第4版中关于方差分析的章节,包括:多样本均数比较的方差分析/多因素实验资料的方差分析/重复测量设计资料的方差分析/协方差分析。 本书电子版及配套数据已放在QQ群,需要的加群下载即可。 多样本均数比较的方差分析 阅读全文
posted @ 2023-03-28 13:43
医学和生信笔记
阅读(222)
评论(0)
推荐(0)
摘要:
前面介绍了多个样本均数的多重比较,多样本非参数检验后的多重比较, 今天学习下重复测量数据的多重比较,本篇内容和课本结果差异较大,如有错误欢迎指出。 使用的课本是孙振球,徐勇勇《医学统计学》第4版。 重复测量方差分析 使用课本例12-1的数据,直接读取: df12_3 <- foreign::read 阅读全文
posted @ 2023-03-28 13:42
医学和生信笔记
阅读(381)
评论(0)
推荐(0)
摘要:
R语言中的factor()函数可以把变量变为因子类型,默认是没有等级之分的(可以理解为无序分类变量nominal)!当然也可以通过添加参数ordered=T变成有序因子(等级资料,有序分类ordinal)。 二项logistic回归 因变量是二分类变量时,可以使用二项逻辑回归(binomial lo 阅读全文
posted @ 2023-03-28 13:42
医学和生信笔记
阅读(913)
评论(0)
推荐(0)

浙公网安备 33010602011771号