Mahout实现的机器学习算法集:
算法大类 | 算法名称 | 中文名称 |
分类算法 | Logistic Regression | 逻辑回归 |
| Bayesian | 贝叶斯 |
| SVM | 支持向量机 |
| Perceptron | 感知器算法 |
| Neural Network | 神经网络 |
| Random Forests | 随机森林 |
| Restricted Boltzmann Machines | 有限波尔兹曼机 |
聚类算法 | Canopy Clustering | Canopy聚类 |
| K-means Clustering | K均值算法 |
| Fuzzy K-means | 模糊K均值 |
| Expectation Maximization | EM聚类(期望最大化聚类) |
| Mean Shift Clustering | 均值漂移聚类 |
| Hierarchical Clustering | 层次聚类 |
| Dirichlet Process Clustering | 狄里克雷过程聚类 |
| Latent Dirichlet Allocation | LDA聚类 |
| Spectral Clustering | 谱聚类 |
关联规则挖掘 | Parallel FP Growth Algorithm | 并行FP Growth算法 |
回归 | Locally Weighted Linear Regression | 局部加权线性回归 |
降维/维约简 | Singular Value Decomposition | 奇异值分解 |
| Principal Components Analysis | 主成分分析 |
| Independent Component Analysis | 独立成分分析 |
| Gaussian Discriminative Analysis | 高斯判别分析 |
进化算法 | 并行化了Watchmaker框架 |
|
推荐/协同过滤 | Non-distributed recommenders | Taste(UserCF, ItemCF, SlopeOne) |
| Distributed Recommenders | ItemCF |
向量相似度计算 | RowSimilarityJob | 计算列间相似度 |
| VectorDistanceJob | 计算向量间距离 |
非Map-Reduce算法 | Hidden Markov Models | 隐马尔科夫模型 |
集合方法扩展 | Collections | 扩展了java的Collections类 |