随笔分类 -  机器学习

摘要:一、Dirichlet-Multinomial共轭 二、LDA=PLSA(Probabilistic Latent Semantic Analysis)+bayes 三、训练方法有gibbs sampling(吉布斯采样)和variation inference-EM算法(变分推断-EM算法) 四、 阅读全文
posted @ 2019-10-26 21:20 熊猫blue 阅读(395) 评论(0) 推荐(0)
摘要:搜索引擎推荐问题:通过查看互联网上的用词来找出经常在一块出现的词对。 FP-growth是一种高效发现频繁集的方法。它只需要对数据库进行两次扫描,第一遍扫描是对所有元素项的出现次数进行计数,统计出现的频率,第二遍扫描只考虑那些频繁元素。 适用数据类型:标称型数据 优点:一般快于Apriori 算法介 阅读全文
posted @ 2019-10-07 17:26 熊猫blue 阅读(743) 评论(0) 推荐(0)
摘要:summary: 关联分析是用于发现大数据集中元素间有趣关系的一个工具集,可以采用两种方式来量化这些有趣的关系。第一种方式是频繁项集,它会给出经常出现在一起的元素项;第二种方式是关联规则,每条关联规则意味着元素项之间“如果……那么”的关系。 发现元素项间不同的组合是个十分耗时的任务,不可避免需要大量 阅读全文
posted @ 2019-10-07 07:41 熊猫blue 阅读(1140) 评论(0) 推荐(0)

点击右上角即可分享
微信分享提示