随笔分类 -  数据挖掘算法

摘要:高数基础1:创建函数的导数求函数极值步骤: 阅读全文
posted @ 2016-01-02 09:11 zhanggl 阅读(226) 评论(0) 推荐(0)
摘要:1、基于用户的协同过滤算法步骤: 1.1找到和目标用户兴趣相似的用户集合 1.2 找到这个集合中的用户喜欢的,且目标用户没有听过的物品推荐给目标用户步骤1的关键是计算2用户的兴趣相似度。2、基于物品的协同过滤算法 2.1计算物品之间的相似度 2.2根据物品的相似度和用户的历史行为给用户生成推... 阅读全文
posted @ 2015-12-07 11:11 zhanggl 阅读(1120) 评论(0) 推荐(0)
摘要:在关联规则挖掘领域最经典的算法法是Apriori,其致命的缺点是需要多次扫描事务数据库。于是人们提出了各种裁剪(prune)数据集的方法以减少I/O开支支持度和置信度严格地说Apriori和FP-Tree都是寻找频繁项集的算法,频繁项集就是所谓的“支持度”比较高的项集,下面解释一下支持度和置信度的概... 阅读全文
posted @ 2015-11-26 23:29 zhanggl 阅读(1241) 评论(0) 推荐(0)
摘要:Apriori算法采用的是自底向上的方法,从1-频繁集开始,逐步找出高阶频繁集。它的基本流程是:第一次扫描交易数据库D时,产生1- 频繁集。在此基础上经过连接、修剪产生2-频繁集。以此类推,直到无法产生更高阶的频繁集为止。在第k次循环中,也就是产生k-频繁集的时候,首先产生 k-候选集,k-候选集中... 阅读全文
posted @ 2015-11-26 23:11 zhanggl 阅读(241) 评论(0) 推荐(0)