摘要: 并行FP Growth算法思路 上图的单线程形成的FP Tree。 分布式算法事实上是对FP Tree进行分割,分而治之 首先,假设我们只关心...|c这个conditional transaction,那么可以把每个transaction中的...|c保留,并发送到一个计算节点中,必然能在该计算节 阅读全文
posted @ 2017-11-01 22:23 wlu 阅读(1080) 评论(0) 推荐(0) 编辑
摘要: 算法跟传统的kmeans的区别主要在于:kmeans||的k个中心的不是随机初始化的。而是选择了k个彼此“足够”分离的中心。 This is a variant of k means++ that tries to find dissimilar cluster centers by startin 阅读全文
posted @ 2017-11-01 15:43 wlu 阅读(205) 评论(0) 推荐(0) 编辑