当前位置：首页 > 软件库 > 神经网络/人工智能 > 机器学习/深度学习 >

TabML

表格数据的机器学习管道

授权协议 Apache-2.0

开发语言 Python

所属分类神经网络/人工智能、机器学习/深度学习

软件类型开源软件

地区不详

投递者吕灿

操作系统跨平台

开源组织无

适用人群未知

软件概览

TabML 旨在创建一个通用的机器学习框架来处理表格数据。

主要特点：

处理表格数据的最重要任务之一是处理特征提取。TabML 允许用户独立定义多个功能，而不必担心其他功能。如果你的团队有多个成员同时开发不同的功能，这有助于减少编码冲突。此外，如果需要更新一项功能，则可以不涉及不相关的功能。通过这种方式，计算成本相对较小（与运行管道以重新生成所有其他特征相比）。
参数在配置文件中指定为 protobuf 文件。每次训练后，此配置文件会自动保存到实验文件夹中，以实现可重复性。
TabML 与 MLflow 集成，允许用户跟踪所有模型参数和指标。
支持表格数据的多个 ML 包：
- LightGBM
- XGBoost
- CatBoos

相关资料

8. 大数据与机器学习

Kubernetes 在大数据与机器学习中的实践案例。
8. 大数据与机器学习 - Tensorflow

Kubeflow 是 Google 发布的用于在 Kubernetes 集群中部署和管理 tensorflow 任务的框架。主要功能包括用于管理 Jupyter 的 JupyterHub 服务用于管理训练任务的 Tensorflow Training Controller 用于模型服务的 TF Serving 容器部署部署之前需要确保一套部署好的 Kubernetes 集群或者 Mini
8. 大数据与机器学习 - Spark

Kubernetes 从 v1.8 开始支持原生的Apache Spark应用（需要Spark支持Kubernetes，比如v2.2.0-kubernetes-0.4.0），可以通过 spark-submit 命令直接提交Kubernetes任务。比如计算圆周率 bin/spark-submit --deploy-mode cluster --class org.apache.spark.
机器学习

Python 有着海量的可用于数据分析、统计以及机器学习的库，这使得 Python 成为很多数据科学家所选择的语言。下面我们列出了一些被广泛使用的机器学习及其他数据科学应用的 Python 包。 Scipy 技术栈 Scipy 技术栈由一大批在数据科学中被广泛使用的核心辅助包构成，可用于统计分析与数据可视化。由于其丰富的功能和简单易用的特性，这一技术栈已经被视作实现大多数数据科学应用的必备品了。
机器学习

主要内容前言课程列表推荐学习路线数学基础初级程序语言能力机器学习课程初级数学基础中级机器学习课程中级推荐书籍列表机器学习专项领域学习致谢前言我们要求把这些课程的所有Notes,Slides以及作者强烈推荐的论文看懂看明白，并完成所有的老师布置的习题，而推荐的书籍是不做要求的，如果有些书籍是需要看完的，我们会进行额外的说明。课程列表课程机构参考书 Notes等其他资
机器学习

机器学习与人工智能学习笔记，包括机器学习、深度学习以及常用开源框架（Tensorflow、PyTorch）等。机器学习算法 _图片来自scikit-learn_。机器学习全景图 _图片来自http://www.shivonzilis.com/_。
机器学习

机器学习与人工智能学习笔记，包括机器学习、深度学习以及常用开源框架（Tensorflow、PyTorch）等。
机器学习：集成学习

“三个臭皮匠顶个诸葛亮”。集成学习就是利用了这样的思想，通过把多分类器组合在一起的方式，构建出一个强分类器；这些被组合的分类器被称为基分类器。事实上，随机森林就属于集成学习的范畴。通常，集成学习具有更强的泛化能力，大量弱分类器的存在降低了分类错误率，也对于数据的噪声有很好的包容性。

TabML

同类工具

相关阅读

相关文章

相关问答

相关文档