摘要:
分类分析--支持向量机 支持向量机(SVM)是一类可用于分类和回归的有监督机器学习模型。其流行归功于两个方面:一方面,他们可输出较准确的预测结果;另一方面,模型基于较优雅的数学理论。 SVM旨在在多维空间中找到一个能将全部样本单元分成两类的最优平面,这一平面应使两类中距离最近的点的间距(margin 阅读全文
posted @ 2021-08-17 16:48
zhang-X
阅读(1126)
评论(0)
推荐(0)
摘要:
分类分析--随机森林 随机森林(random forest)是一种组成式的有监督学习方法。在随机森林中,我们同时生成多个预测模型,并将模型的结果汇总以提升分类准确率。随机森林的算法涉及对样本单元和变量进行抽样,从而生成大量决策树。对每个样本单元来说,所有决策树依次对其进行分类。所有决策树预测类别中的 阅读全文
posted @ 2021-08-17 16:44
zhang-X
阅读(1782)
评论(0)
推荐(0)
摘要:
分类分析--决策树 决策树是数据挖掘领域中的常用模型。其基本思想是对预测变量进行二元分离,从而构造一棵可用于预测新样本单元所属类别的树。两类决策树:经典树和条件推断树。 1 经典决策树 经典决策树以一个二元输出变量(对应威斯康星州乳腺癌数据集中的良性/恶性)和一组预测变量(对应九个细胞特征)为基础。 阅读全文
posted @ 2021-08-17 16:41
zhang-X
阅读(5188)
评论(0)
推荐(0)
摘要:
分类分析--逻辑回归 逻辑回归(logistic regression)是广义线性模型的一种,可根据一组数值变量预测二元输出,即逻辑回归只适用于二分类 ,R中的基本函数glm()可用于拟合逻辑回归模型。glm()函数自动将预测变量中的分类变量编码为相应的虚拟变量。威斯康星乳腺癌数据中的全部预测变量都 阅读全文
posted @ 2021-08-17 16:37
zhang-X
阅读(1287)
评论(0)
推荐(0)
摘要:
分类分析 有监督机器学习领域中包含许多可用于分类的方法,如逻辑回归、决策树、随机森林、支持向量机、神经网络等,有监督学习基于一组包含预测变量值和输出变量值的样本单元。将全部数据分为一个训练集和一个验证集,其中训练集用于建立预测模型,验证集用于测试模型的准确性。 主要例子来源于UCI机器学习数据库中的 阅读全文
posted @ 2021-08-17 16:35
zhang-X
阅读(336)
评论(0)
推荐(0)

浙公网安备 33010602011771号