自然语言处理
ScalaNLP—机器学习和数值计算库的套装
Breeze —Scala用的数值处理库
Chalk—自然语言处理库。
FACTORIE—可部署的概率建模工具包,用Scala实现的软件库。为用户提供简洁的语言来创建关系因素图,评估参数并进行推断。
数据分析/数据可视化
MLlib in Apache Spark—Spark下的分布式机器学习库
Scalding —CAscading的Scala接口
Summing Bird—用Scalding 和 Storm进行Streaming MapReduce
Algebird —Scala的抽象代数工具
xerial —Scala的数据管理工具
simmer —化简你的数据,进行代数聚合的unix过滤器
PredictionIO —供软件开发者和数据工程师用的机器学习服务器。
BIDMat—支持大规模探索性数据分析的CPU和GPU加速矩阵库。
通用机器学习
Conjecture—Scalding下可扩展的机器学习框架
brushfire—scalding下的决策树工具。
ganitha —基于scalding的机器学习程序库
adam—使用Apache Avro, Apache Spark 和 Parquet的基因组处理引擎,有专用的文件格式,Apache 2软件许可。
bioscala —Scala语言可用的生物信息学程序库
BIDMach—机器学习CPU和GPU加速库。
Figaro - 一个构造概率性模型的Scala库
英文原文链接:Scala机器学习