mahout实现的算列表
mahout实现的算法:(翻译自mahout官方文档:点击打开链接)
(一)Classification(分类算法)
完全支持:
1.Logistic Regression(Logistic回归)
2.Naive Bayes/ Complementary Naive Bayes(朴素贝叶斯/互补的朴素贝叶斯)
3.Random Forests(随机森林)
4.Hidden Markov Models(隐马尔可夫模型)
即将支持:
5.Online Passive Aggressive(在线被动攻击)
(二)Dimension reduction(聚类算法)
完全支持:
1.Canopy Clustering(Canopy聚类)
2.K-Means Clustering(K-Means聚类)
3.Fuzzy K-Means(模糊K-Means聚类)
4.Mean Shift Clustering(均值漂移聚类)
5.Dirichlet Process Clustering (狄利克雷过程聚类)
6.Latent Dirichlet Allocation(潜在狄利克雷分配)
7.Minhash Clustering(Minhash聚类)
8.kMeans++ streaming clustering(k均值+ +流媒体集群)
即将支持:
9.Hierarchical Clustering(层次聚类)
10.Spectral Clustering(谱聚类)
(三)Dimension reduction(降维)
完全支持
1.Singular Value Decomposition and other Dimension Reduction Techniques(奇异值分解和其他降维技术)
2.Stochastic Singular Value Decomposition with PCA workflow(随机奇异值分解与PCA工作流程)
即将支持:
3.Principal Components Analysis(主成分分析)
4.Gaussian Discriminative Analysis(高斯辨析)
(四)Evolutionary Algorithms(进化算法)
注:进化算法已经在mahout0.7版本中移除了。
(五)推荐引擎/协同过滤(Recommenders/Collaborative Filtering)
Mahout中包含了简单非分布式推荐引擎的实现和基于hadoop分布式推荐引擎的实现。
算法类 |
算法名 |
中文名 |
分类算法 |
Logistic Regression |
逻辑回归 |
Bayesian |
贝叶斯 |
|
SVM |
支持向量机 |
|
Perceptron |
感知器算法 |
|
Neural Network |
神经网络 |
|
Random Forests |
随机森林 |
|
Restricted Boltzmann Machines |
有限波尔兹曼机 |
|
聚类算法 |
Canopy Clustering |
Canopy聚类 |
K-means Clustering |
K均值算法 |
|
Fuzzy K-means |
模糊K均值 |
|
Expectation Maximization |
EM聚类(期望最大化聚类) |
|
Mean Shift Clustering |
均值漂移聚类 |
|
Hierarchical Clustering |
层次聚类 |
|
Dirichlet Process Clustering |
狄里克雷过程聚类 |
|
Latent Dirichlet Allocation |
LDA聚类 |
|
Spectral Clustering |
谱聚类 |
|
关联规则挖掘 |
Parallel FP Growth Algorithm |
并行FP Growth算法 |
回归 |
Locally Weighted Linear Regression |
局部加权线性回归 |
降维/维约简 |
Singular Value Decomposition |
奇异值分解 |
Principal Components Analysis |
主成分分析 |
|
Independent Component Analysis |
独立成分分析 |
|
Gaussian Discriminative Analysis |
高斯判别分析 |
|
进化算法 |
并行化了Watchmaker框架 |
|
推荐/协同过滤 |
Non-distributed recommenders |
Taste(UserCF, ItemCF, SlopeOne) |
Distributed Recommenders |
ItemCF |
|
向量相似度计算 |
RowSimilarityJob |
计算列间相似度 |
VectorDistanceJob |
计算向量间距离 |
|
非Map-Reduce算法 |
Hidden Markov Models |
隐马尔科夫模型 |
集合方法扩展 |
Collections |
扩展了java的Collections类 |