上一页 1 2 3 4 5 6 7 8 9 ··· 17 下一页
摘要: 链接: 条件推断树、决策树 : https://www.cnblogs.com/YY-zhang/p/15152971.html 随机森林: https://www.cnblogs.com/YY-zhang/p/15152992.html SVM :https://www.cnblogs.com/Y 阅读全文
posted @ 2021-11-19 13:00 zhang-X 阅读(182) 评论(0) 推荐(0)
摘要: 使用ggplot2进行数据可视化 1 mpg数据框 mpg 包含了由美国环境保护协会收集的 38 种车型的观测数据。 mpg 中包括如下变量。 • displ:引擎大小,单位为升。 • hwy:汽车在高速公路上行驶时的燃油效率,单位为英里 / 加仑(mpg)。与燃油效率高 的汽车相比,燃油效率低的汽 阅读全文
posted @ 2021-11-19 11:29 zhang-X 阅读(943) 评论(0) 推荐(0)
摘要: 1 K最近邻 这部分即将要讨论的K最近邻和后面的有权重K最近邻算法在R中的实现,其核心函数 knn()与 kknn()集判别规则的“建立”和“预测”这两个步骤于一体,即不需在规则建立后再使用predict()函数来进行预测,可由knn()和 kknn()一步实现。 按照次序向knn()函数中依次放入 阅读全文
posted @ 2021-09-08 19:34 zhang-X 阅读(1067) 评论(0) 推荐(0)
摘要: 1 朴素贝叶斯分类 我们使用NaiveBayes()函数来实现朴素贝叶斯分类算法,我们分为两种函数格式来分别介绍: #install.packages("klaR") library(klaR) library("MASS") (1)公式 formula格式 以nmkat为待判别变量,以datatr 阅读全文
posted @ 2021-09-08 19:32 zhang-X 阅读(694) 评论(0) 推荐(0)
摘要: 应用案例 1 线性判别分析 执行线性判别分析可使用lda()函数,且该函数有三种执行形式,依次尝试使用。 (1)公式formula格式 我们使用nmkat变量作为待判别变量,其他剩余的变量作为特征变量,根据公式nmkat~使用训练集数据来运行lda()函数: library(MASS) librar 阅读全文
posted @ 2021-09-08 19:29 zhang-X 阅读(1900) 评论(0) 推荐(0)
摘要: 数据集 我们选用kknn软件包中的miete数据集进行算法演示,该数据集记录了1994年慕尼黑的住房租金标准中的一些有趣变量,比如房子的面积、是否有浴室、是否有中央供暖、是否供应热水等,这些都影响并决定着租金的高低。 1 数据概况 library(kknn) data(miete) head(mie 阅读全文
posted @ 2021-09-08 19:22 zhang-X 阅读(678) 评论(0) 推荐(0)
摘要: R中的实现 1 相关软件包 R中的实现主要涉及4个软件包中的相关函数,它们依次为MASS.klaR、class和 kknn。 其中,MASS包的名称为Modern Applied Statistics with S的缩写,即S语言的现代应用统计, 该包中含有大量实用而先进的统计技术函数及适用数据集; 阅读全文
posted @ 2021-09-08 19:19 zhang-X 阅读(605) 评论(0) 推荐(0)
摘要: 判别分析 比较理论一些来说,判别分析就是根据已掌握的每个类别若干样本的数据信息,总结出客观事物分类的规律性,建立判别公式和判别准则;在遇到新的样本点时,再根据已总结出来的判别公式和判别准则,来判断出该样本点所属的类别。 1 概述 三大类主流的判别分析算法,分别为费希尔(Fisher)判别、贝叶斯(B 阅读全文
posted @ 2021-09-08 19:16 zhang-X 阅读(6715) 评论(0) 推荐(1)
摘要: R中的实现 1 相关软件包 R中两个专用于关联分析的软件包-—arules 和 arulesViz。其中,arules用于关联规则的数字化生成,提供Apriori和 Eclat这两种快速挖掘频繁项集和关联规则算法的实现函数;而arulesViz软件包作为arules 的扩展包,提供了几种实用而新颖的 阅读全文
posted @ 2021-09-08 19:03 zhang-X 阅读(1747) 评论(0) 推荐(0)
摘要: 关联分析 概述 关联分析是数据挖掘的核心技术之一,其关联规则模型及数据挖掘算法是由 IBM 公司Almaden研究中心的R.Agrawal在1993年首先提出的,目的是从大量数据中发现项集之间的有趣关联或相互关系,其中最经典的Apriori算法在关联规则分析领域具有很大的影响力。 1.项集(ltem 阅读全文
posted @ 2021-09-08 19:01 zhang-X 阅读(6343) 评论(0) 推荐(0)
上一页 1 2 3 4 5 6 7 8 9 ··· 17 下一页