当前位置: 首页 > 面试题库 >

如何解决数据不平衡问题?

齐建安
2023-03-14
本文向大家介绍如何解决数据不平衡问题?相关面试题,主要包含被问及如何解决数据不平衡问题?时的应答技巧和注意事项,需要的朋友参考一下

这主要是由于数据分布不平衡造成的。解决方法如下:

采样,对小样本进行加噪声采样,对大样本进行下采样 进行特殊的加权,如在Adaboost中或者SVM 采用对不平衡数据集不敏感的算法 改变评价标准:用AUC|ROC来进行评价 考虑数据的先验分布
https://blog.csdn.net/zxj942405301/article/details/78059719?fps=1&locationNum=5

 类似资料:
  • 本文向大家介绍数据不平衡怎么办?相关面试题,主要包含被问及数据不平衡怎么办?时的应答技巧和注意事项,需要的朋友参考一下 参考回答: 使用正确的评估标准,当数据不平衡时可以采用精度,调用度,F1得分,MCC,AUC等评估指标。 重新采样数据集,如欠采样和过采样。欠采样通过减少冗余类的大小来平衡数据集。当数据量不足时采用过采样,尝试通过增加稀有样本的数量来平衡数据集,通过使用重复,自举,SMOTE等方

  • 问题内容: 我正在尝试训练数据不平衡的网络。我有A(198个样本),B(436个样本),C(710个样本),D(272个样本),并且我已经阅读了有关“weighted_cross_entropy_with_logits”的信息,但是我发现的所有示例都是针对二进制分类的,因此我不太了解对如何设置这些权重充满信心。 样本总数:1616 A_weight:198/1616 = 0.12? 如果我理解的话

  • 问题 Lena正在准备一场重要的编码竞赛,在此之前有许多连续的预赛。最初,她的运气平衡是0。她相信“节省运气”,并想检查她的理论。每场比赛都由两个整数描述,和: 是与比赛相关的运气量。如果莉娜赢得比赛,她的运气余额将减少;如果她失去了它,她的运气余额将增加 表示比赛的重要性评级。如果比赛很重要,则等于 ,如果比赛不重要,则等于 。 如果Lena在不超过< code>k场重要比赛中失利,她在所有预赛

  • A 电脑是 windows 2008 x64, sql server 2008, IP 192.168.12.1 B 电脑是 windows 2019 x64, sql server 2019, IP 192.168.4.12 请问如何设定为主从关系?

  • 问题内容: 下面的程序引发NullPointerException。在Log cat中,它显示: 单击该按钮时,它不会进入Mousefragment类。我试图解决它,但是我不能-如何解决这个问题? 编辑 单击该按钮多少次,该异常随同invalid_ip Toast消息一起显示 问题答案: 如前所述,您的问题询问如何解决此问题。 您需要弄清楚在哪里抛出。为此,请查看堆栈跟踪以查看引起问题的行。然后,