摘要: 在Spark2.0版本中(不是基于RDD API的MLlib),共有四种聚类方法: (1)K-means (2)Latent Dirichlet allocation (LDA) (3)Bisecting k-means(二分k均值算法) (4)Gaussian Mixture Model (GMM 阅读全文
posted @ 2018-02-01 17:35 大葱拌豆腐 阅读(1098) 评论(0) 推荐(0)
摘要: EM算法概述 (1)数学之美的作者吴军将EM算法称之为上帝的算法,EM算法也是大家公认的机器学习十大经典算法之一。EM是一种专门用于求解参数极大似然估计的迭代算法,具有良好的收敛性和每次迭代都能使似然函数值单调不减的优良性质。在统计机器学习、自然语言处理等领域应用非常广泛,许多统计学算法都是EM算法 阅读全文
posted @ 2018-02-01 17:12 大葱拌豆腐 阅读(828) 评论(0) 推荐(0)
摘要: 在Spark2.0版本中(不是基于RDD API的MLlib),共有四种聚类方法: (1)K-means (2)Latent Dirichlet allocation (LDA) (3)Bisecting k-means(二分k均值算法) (4)Gaussian Mixture Model (GMM 阅读全文
posted @ 2018-02-01 13:44 大葱拌豆腐 阅读(1116) 评论(0) 推荐(0)