FP-TREE 算法,频繁项集与关联规则分析

使用场景如:

用户频道属性分析 、用户忠诚度分析 、用户偏好路径分析、 用户偏好终端分析、 用户访问网站时间分析、 用户浏览内容分析

 

例子:一用户某次访问网站的路径示意图

                   

ABCD    ABEGH    ABEGW   AOU   AOV

Apriori算法

        需要扫描多个事物数据集,增加IO开销。会产生2的k次方频繁项集。

 

FP-Tree算法

概念: 树 链 节点 节点的前向路径 单支 多支 条件基

 


若Tree为单支,则输出整条单支和条件基BASE,支持度为单支中所有节点支持度的最小值。
 

  1. 若Tree为多支,先输出项表头HEAD中每项与条件基BASE的组合。然后,对于项表头中的每一项,取出该项在Tree中的所有前向路径,每条路径的基础支持度为该项的支持度。
  2. M条路径共M行数据,将这M行数据重新生成Tree,返回算法步骤-3中的1。

 


 

 

 

--->流程参考

posted @ 2016-03-30 18:44  ChangCrazy  阅读(2729)  评论(0编辑  收藏  举报