贝叶斯决策理论(1)
posted @ 2019-12-26 18:02
posted @ 2019-12-26 18:02
posted @ 2019-09-03 18:11
posted @ 2019-08-29 19:01
posted @ 2019-06-19 16:16
posted @ 2018-08-15 17:14
posted @ 2018-08-15 11:33
posted @ 2018-07-31 11:30
posted @ 2018-07-17 17:33
posted @ 2018-07-13 16:15
posted @ 2018-07-03 18:39
posted @ 2018-06-29 17:31
posted @ 2018-06-26 15:45
posted @ 2018-06-17 21:11
posted @ 2018-06-09 15:18
posted @ 2018-04-03 22:14
posted @ 2018-04-03 22:03
posted @ 2018-03-26 16:27
常见的挖掘频繁项集算法有两类,一类是Apriori算法,另一类是FPGrowth。Apriori通过不断的构造候选集、筛选候选集挖掘出频繁项集,需要多次扫描原始数据,当原始数据较大时,磁盘I/O次数太多,效率比较低下。FPGrowth不同于Apriori的“试探”策略,算法只需扫描原始数据两遍,通过FP-tree数据结构对原始数据进行压缩,效率较高。FP代表频繁模式(Frequent Pattern) ,算法主要分为两个步骤:FP-tree构建、挖掘频繁项集。本文是FP-growth算法的第二篇,主要介绍通过条件FP树发现频繁项集
阅读全文
posted @ 2017-09-08 08:44
常见的挖掘频繁项集算法有两类,一类是Apriori算法,另一类是FPGrowth。Apriori通过不断的构造候选集、筛选候选集挖掘出频繁项集,需要多次扫描原始数据,当原始数据较大时,磁盘I/O次数太多,效率比较低下。FPGrowth不同于Apriori的“试探”策略,算法只需扫描原始数据两遍,通过FP-tree数据结构对原始数据进行压缩,效率较高。FP代表频繁模式(Frequent Pattern) ,算法主要分为两个步骤:FP-tree构建、挖掘频繁项集。本文是FP-growth算法的第一篇,主要介绍如何构建FPTree
阅读全文
posted @ 2017-09-05 22:39
大型超市有海量交易数据,我们可以通过聚类算法寻找购买相似物品的人群,从而为特定人群提供更具个性化的服务。但是对于超市来讲,更有价值的是如何找出商品的隐藏关联,从而打包促销,以增加营业收入。其中最经典的案例就是关于尿不湿和啤酒的故事。怎样在繁杂的数据中寻找到数据之间的隐藏关系?当然可以使用穷举法,但代价高昂,所以需要使用更加智能的方法在合理时间内找到答案。Apriori就是其中的一种关联分析算法。本文是Apriori的第二篇,介绍如何在频繁项集的基础上挖掘关联规则。
阅读全文
posted @ 2017-08-29 22:32