fp-growth算法

1.对1项集求支持度(计数)

2.将计数(频度)低于最小值的过滤掉,将剩下的一项集排序(降序)

3.参照排序后的一项集将初始的数据集依次排序

4.将排好序的数据集从根节点开始建树,根节点初始化为空

5.建树的过程中对经过的节点进行计数,得到节点带权重的多叉树

6.对每个节点从节点开始向祖先节点遍历,将祖先节点的权重变成子节点的数量(开始的叶子节点),将权重低于该子节点的去掉。

结果组合成该节点的最大频繁项集

 

posted @ 2018-04-10 18:05  Aemnprsu_wx  阅读(157)  评论(0)    收藏  举报