当前位置: 首页 > 文档资料 > Angel 中文文档 >

算法类问题

优质
小牛编辑
112浏览
2023-12-01

Angel是一个分布式机器学习平台,在上面运行算法,得到模型,这只是第一步,更加关键第二步,训练出来模型,要有比较好的准确率,可以对数据进行准确预测。在这个过程中,用户可能会遇到各种各样的问题,这里我们也一一总结一下

LR

模型不收敛,预测效果差

  1. 请检查正则项系数是否适合,过大的正则项参数会影响模型收敛,建议不大于 1/featureNum
  2. 检查Learn Rate是否过大
  3. 检查数据预处理是否有做好

模型收敛慢、收敛效果不好:Auc上涨、Loss下降速度慢,指标停留在一个不算好的值

  1. 试试调大Learn Rate
  2. 调小Decay
  3. 增大batchNum

准备训练数据的注意事项:

  1. 数据清洗时,通过采样控制正负样本差距不要太大
  2. 正负样本均匀随机分布,避免出现某个batch中完全没有正样本或者负样本的情况
  3. Angel后续加入读取后均匀化的功能,把正样本平均的插到负样本中

(感谢QQ群[20171688]里 陈浩拓宇 的贡献)

项目地址:https://github.com/Angel-ML/angel
官网:https://angelml.ai/