摘要: 在关联规则挖掘领域最经典的算法法是Apriori,其致命的缺点是需要多次扫描事务数据库。于是人们提出了各种裁剪(prune)数据集的方法以减少I/O开支,韩嘉炜老师的FP-Tree算法就是其中非常高效的一种。 名词约定 举个例子,设事务数据库为: 每一行为一个事务,事务由若干个互不相同的项目构成,任 阅读全文
posted @ 2011-10-04 15:09 张朝阳 阅读(63458) 评论(46) 推荐(17) 编辑