关联分析(Apriori算法)

两个概念:

频繁项集:常出现的物品集合

关联分析:找到诸如:尿布-->啤酒的关联,反过来则是另一条

两个控制参数:

项集的支持度(support):一个项集出现的次数在所有样本中出现的比例

可信度或置信度(confidence):定义为:支持度(尿布,啤酒)/支持度(尿布)

posted @ 2015-04-30 17:39  fkissx  阅读(239)  评论(0编辑  收藏  举报