摘要: 第三章、分类 1.分类(相当于构建一个分类器) 1.1 分类的基本介绍: 给定一个预定义的类标签集合,分类的任务是使用分类器的训练模型,为输入数据集的每个数据对象分配一个标签。通常,输入可能是离散值,也可能是连续值,但输出是离散二进制值或者名义数值等。分类算法通常描述为学习模型或函数。 f(x,y) 阅读全文
posted @ 2019-09-24 23:44 Nelson_software 阅读(782) 评论(0) 推荐(0)
摘要: 第二章、频繁模式、关联规则和相关规则挖掘 关联规则挖掘算法可以从多种数据类型中发现频繁项集,包括数值数据和分类数据,基础算法有Apriori算法和FP-Growth算法。 1.关联模式和关联规则 1.1 模式和模式发现(频繁模式可以有以下几种形式) 1.1.1频繁项集 项集:项集就是项的集合,例如: 阅读全文
posted @ 2019-09-24 18:32 Nelson_software 阅读(1369) 评论(0) 推荐(0)
摘要: 写在前面:此系列文章以《R语言数据挖掘》为主线,记录自己学习数据挖掘和算法的过程。 还引用了大量前辈的博客总结,先谢过。 第一章、预备知识 1.大数据 2.数据源 3.数据挖掘 数据挖掘算法与数据结构算法对比: https://www.cnblogs.com/Alear/p/10840230.htm 阅读全文
posted @ 2019-09-24 11:37 Nelson_software 阅读(228) 评论(0) 推荐(0)