当前位置: 首页 > 软件库 > 神经网络/人工智能 > >

LightGBM

GBDT 算法实现框架
授权协议 MIT
开发语言 C/C++ Python
所属分类 神经网络/人工智能
软件类型 开源软件
地区 不详
投 递 者 童宏富
操作系统 跨平台
开源组织 微软
适用人群 未知
 软件概览

LightGBM(Light Gradient Boosting Machine) 是微软开源的一个实现 GBDT 算法的框架,支持高效率的并行训练。

GBDT (Gradient Boosting Decision Tree) 是机器学习中一个长盛不衰的模型,其主要思想是利用弱分类器(决策树)迭代训练以得到最优模型,该模型具有训练效果好、不易过拟合等优点。GBDT 在工业界应用广泛,通常被用于点击率预测,搜索排序等任务。GBDT 也是各种数据挖掘竞赛的致命武器,据统计 Kaggle 上的比赛有一半以上的冠军方案都是基于 GBDT。

LightGBM 提出的主要原因是为了解决 GBDT 在海量数据遇到的问题,让 GBDT 可以更好更快地用于工业实践。其具有以下优点:

  • 更快的训练速度

  • 更低的内存消耗

  • 更好的准确率

  • 分布式支持,可以快速处理海量数据

  • lightGBM官网中文文档! LightGBM是打比赛如CCF大数据与天池大数据竞赛的经常被使用的模型 一:模型简介 lightgbm是xgboost的加强升级版. LightGBM=XGBoost+Histogram+GOSS+EFB 其中,Histogram算法是直方图算法,作用:减少后选分类点的算法 GOSS是基于梯度的单边采样算法,作用减少样本数量 EFB算法是互斥特征捆绑算法,作用是减

  • 参考:https://www.freesion.com/article/76441004344/#LightGBM__sklearn__329 https://blog.csdn.net/qq_39777550/article/details/109277937 LightGBM的优点 lightgbm是xgboost的加强升级版. LightGBM=XGBoost+Histogram+GOSS+

  • 以 Breast Cancer Dataset数据集为例实现基于python的lightgbm开发实现模型训练: import numpy as np from collections import Counter import pandas as pd import lightgbm as lgb from sklearn.datasets import load_breast_cancer,l

 相关资料
  • 调度框架和调度算法设计与实现

  • 本文向大家介绍SMO算法实现?相关面试题,主要包含被问及SMO算法实现?时的应答技巧和注意事项,需要的朋友参考一下 选择原凸二次规划的两个变量,其他变量保持不变,根据这两个变量构建一个新的二次规划问题,这样将原问题划分为更小的子问题可以大大加快计算速度,而选择变量的方式是: 其中一个是严重违反KKT条件的一个变量 另一个变量是根据自由约束确定的

  • 我无法实现SJF(最短作业优先)算法。 SJF就是这样工作的 如果进程到达0时间,它将工作到下一个进程到达,算法必须检查到达1的到达(进程/进程)是否比当前剩余时间短 示例:P0执行了1,还有2要完成,现在我们有P0,P1,P2,P3,P4 in 1算法将执行最短的一个P3,之后是P0,然后是P4,然后是P1,依此类推。问题是我必须保存所有进程的开始和结束时间执行,以及等待时间。 这是我的最新算法

  • 朴素贝叶斯算法 给定数据集$$T={(x{(1)},y{(1)}),(x{(2)},y{(2)}),...,(x{(m)},y{(m)})}$$,其中$$x\in \mathcal{X}\subseteq R^n$$,$$y\in \mathcal{Y}={c_1, c_2,...,c_K}$$,$$X$$是定义在输入空间$$\mathcal{X}$$上的随机向量,$$Y$$是定义在输出空间$$\

  • 线性回归python实现 1.算法python代码 包含Normal Equations,批量梯度下降和随机梯度下降,这里的代码跟Logistic回归的代码类似 # -*- coding: utf-8 -*- import matplotlib.pyplot as plt import numpy as np class LinearRegression(object): def _

  • Logistic回归python实现 1.算法python代码 # -*- coding: utf-8 -*- import matplotlib.pyplot as plt import numpy as np class Logistic(object): def __init__(self): self._history_w = [] self.

  • 1.python代码实现 包含算法的原始形式和对偶形式 # -*- coding: utf-8 -*- import numpy as np class Perceptron(object): def __init__(self, input_x, feature_num, input_y, learn_rate=1): self._input_x = np.arra

  • import scala.language.postfixOps import scala.reflect.ClassTag import org.apache.spark.graphx._ import org.apache.spark.internal.Logging /** * PageRank algorithm implementation. There are two impleme