上一页 1 ··· 5 6 7 8 9 10 11 12 13 ··· 17 下一页
摘要: 分类分析--支持向量机 支持向量机(SVM)是一类可用于分类和回归的有监督机器学习模型。其流行归功于两个方面:一方面,他们可输出较准确的预测结果;另一方面,模型基于较优雅的数学理论。 SVM旨在在多维空间中找到一个能将全部样本单元分成两类的最优平面,这一平面应使两类中距离最近的点的间距(margin 阅读全文
posted @ 2021-08-17 16:48 zhang-X 阅读(1126) 评论(0) 推荐(0)
摘要: 分类分析--随机森林 随机森林(random forest)是一种组成式的有监督学习方法。在随机森林中,我们同时生成多个预测模型,并将模型的结果汇总以提升分类准确率。随机森林的算法涉及对样本单元和变量进行抽样,从而生成大量决策树。对每个样本单元来说,所有决策树依次对其进行分类。所有决策树预测类别中的 阅读全文
posted @ 2021-08-17 16:44 zhang-X 阅读(1782) 评论(0) 推荐(0)
摘要: 分类分析--决策树 决策树是数据挖掘领域中的常用模型。其基本思想是对预测变量进行二元分离,从而构造一棵可用于预测新样本单元所属类别的树。两类决策树:经典树和条件推断树。 1 经典决策树 经典决策树以一个二元输出变量(对应威斯康星州乳腺癌数据集中的良性/恶性)和一组预测变量(对应九个细胞特征)为基础。 阅读全文
posted @ 2021-08-17 16:41 zhang-X 阅读(5188) 评论(0) 推荐(0)
摘要: 分类分析--逻辑回归 逻辑回归(logistic regression)是广义线性模型的一种,可根据一组数值变量预测二元输出,即逻辑回归只适用于二分类 ,R中的基本函数glm()可用于拟合逻辑回归模型。glm()函数自动将预测变量中的分类变量编码为相应的虚拟变量。威斯康星乳腺癌数据中的全部预测变量都 阅读全文
posted @ 2021-08-17 16:37 zhang-X 阅读(1287) 评论(0) 推荐(0)
摘要: 分类分析 有监督机器学习领域中包含许多可用于分类的方法,如逻辑回归、决策树、随机森林、支持向量机、神经网络等,有监督学习基于一组包含预测变量值和输出变量值的样本单元。将全部数据分为一个训练集和一个验证集,其中训练集用于建立预测模型,验证集用于测试模型的准确性。 主要例子来源于UCI机器学习数据库中的 阅读全文
posted @ 2021-08-17 16:35 zhang-X 阅读(336) 评论(0) 推荐(0)
摘要: 避免不存在的类 聚类分析是一种旨在识别数据集子组的方法,并且在此方面十分擅长。事实上,它甚至能发现不存在的类。 install.packages("fMultivar") library(fMultivar) set.seed(1234) df <- rnorm2d(1000, rho=.5) df 阅读全文
posted @ 2021-08-13 17:04 zhang-X 阅读(520) 评论(0) 推荐(0)
摘要: 1 划分聚类分析 1.1 K 均值聚类 最常见的划分方法是K均值聚类分析。从概念上讲,K均值算法如下: (1) 选择K个中心点(随机选择K行); (2) 把每个数据点分配到离它最近的中心点; (3) 重新计算每类中的点到该类中心点距离的平均值(也就说,得到长度为p的均值向量,这里的p是变量的个数); 阅读全文
posted @ 2021-08-13 17:00 zhang-X 阅读(2207) 评论(0) 推荐(0)
摘要: 层次聚类分析 在层次聚类中,起初每一个实例或观测值属于一类。聚类就是每一次把两类聚成新的一类,直到所有的类聚成单个类为止,算法如下: (1) 定义每个观测值(行或单元)为一类; (2) 计算每类和其他各类的距离; (3) 把距离最短的两类合并成一类,这样类的个数就减少一个; (4) 重复步骤(2)和 阅读全文
posted @ 2021-08-13 16:53 zhang-X 阅读(3627) 评论(0) 推荐(0)
摘要: 聚类分析 聚类分析是一种数据归约技术,旨在揭露一个数据集中观测值的子集。它可以把大量的观测值归约为若干个类。 最常用的两种聚类方法是层次聚类(hierarchical agglomerative clustering)和划分聚类(partitioning clustering)。在层次聚类中,每一个 阅读全文
posted @ 2021-08-13 16:45 zhang-X 阅读(789) 评论(0) 推荐(0)
摘要: 指数预测模型 指数模型是用来预测时序未来值的最常用模型。这类模型相对比较简单,但是实践证明它们的短期预测能力较好。不同指数模型建模时选用的因子可能不同。比如单指数模型(simple/single exponential model)拟合的是只有常数水平项和时间点i处随机项的时间序列,这时认为时间序列 阅读全文
posted @ 2021-08-13 16:41 zhang-X 阅读(2391) 评论(0) 推荐(0)
上一页 1 ··· 5 6 7 8 9 10 11 12 13 ··· 17 下一页