当前位置: 首页 > 面试题库 >

Focal Loss 介绍一下

洪伟彦
2023-03-14
本文向大家介绍Focal Loss 介绍一下相关面试题,主要包含被问及Focal Loss 介绍一下时的应答技巧和注意事项,需要的朋友参考一下

参考回答:

Focal loss主要是为了解决one-stage目标检测中正负样本比例严重失衡的问题。该损失函数降低了大量简单负样本在训练中所占的权重,也可理解为一种困难样本挖掘。

损失函数形式:Focal loss是在交叉熵损失函数基础上进行的修改,首先回顾二分类交叉上损失:

img

是经过激活函数的输出,所以在0-1之间。可见普通的交叉熵对于正样本而言,输出概率越大损失越小。对于负样本而言,输出概率越小则损失越小。此时的损失函数在大量简单样本的迭代过程中比较缓慢且可能无法优化至最优。

img

img

首先在原有的基础上加了一个因子,其中gamma>0使得减少易分类样本的损失。使得更关注于困难的、错分的样本。

例如gamma为2,对于正类样本而言,预测结果为0.95肯定是简单样本,所以(1-0.95)的gamma次方就会很小,这时损失函数值就变得更小。而预测概率为0.3的样本其损失相对很大。对于负类样本而言同样,预测0.1的结果应当远比预测0.7的样本损失值要小得多。对于预测概率为0.5时,损失只减少了0.25倍,所以更加关注于这种难以区分的样本。这样减少了简单样本的影响,大量预测概率很小的样本叠加起来后的效应才可能比较有效。

此外,加入平衡因子alpha,用来平衡正负样本本身的比例不均:

img

只添加alpha虽然可以平衡正负样本的重要性,但是无法解决简单与困难样本的问题。

lambda调节简单样本权重降低的速率,当lambda为0时即为交叉熵损失函数,当lambda增加时,调整因子的影响也在增加。实验发现lambda为2是最优。

 类似资料:
  • 本文向大家介绍介绍一下auc?相关面试题,主要包含被问及介绍一下auc?时的应答技巧和注意事项,需要的朋友参考一下 介绍auc,那么就介绍ROC,auc反映的是从样本集中抽出样本,预测这个样本是正例的概率比预测这个样本是反例的概率大的概率,做法是由于每种样本出现的概率已知,将其由小到大进行排序,依次作为截断概率,小于该概率预测为负例,大于该概率预测为正例,这样每个样本都有一个预测值,可以计算出样本

  • 本文向大家介绍介绍一下Python 锁?相关面试题,主要包含被问及介绍一下Python 锁?时的应答技巧和注意事项,需要的朋友参考一下 参考回答: Python中的各种锁: 一、全局解释器锁(GIL) 1、什么是全局解释器锁 每个CPU在同一时间只能执行一个线程,那么其他的线程就必须等待该线程的全局解释器,使用权消失后才能使用全局解释器,即使多个线程直接不会相互影响在同一个进程下也只有一个线程使用

  • 本文向大家介绍请介绍一下ThreadLocal?相关面试题,主要包含被问及请介绍一下ThreadLocal?时的应答技巧和注意事项,需要的朋友参考一下 ThreadLocal简介 通常情况下,我们创建的变量是可以被任何一个线程访问并修改的。如果想实现每一个线程都有自己的专属本地变量该如何解决呢? JDK中提供的类正是为了解决这样的问题。 类主要解决的就是让每个线程绑定自己的值,可以将类形象的比喻成

  • 本章内容 : 建立Python 开发环境 Python 语言简介 变量,字符串,列表,字典介绍 使用用网络,迭代器,异常处理,模块等 写第一个Python 程序,字典密码破解器 写第二个Python 程序,压缩文件密码暴力破解 对我来说,武术的非凡之处在于它的简单。简单是最美的,而武术也没有什么特别之处;以无法为有法,以有限为无限,是为武术最高境界! ——截拳道宗师 李小龙 引文:用python

  • FAQ: 为什么会有这个课程? 笔者最近一直想制作关于 Node 方面的教程书籍,于是笔者下载了非常多的关于 Node.js 的 PDF 书籍,了解一下其他人是如何教大家写 Node.js 的?看完之后我就满脸黑线,why?笔者发现带有实战字眼的书籍,90% 会出现 express,当我看到里面实现的一些功能的时候,我就瞬间斯巴达了。文章标题是制作一个微博,看见这个标题,笔者瞬间感觉书籍作者牛逼闪

  • 本文向大家介绍CycleGAN 原理介绍一下相关面试题,主要包含被问及CycleGAN 原理介绍一下时的应答技巧和注意事项,需要的朋友参考一下 参考回答: CycleGAN其实就是一个A→B单向GAN加上一个B→A单向GAN。两个GAN共享两个生成器,然后各自带一个判别器,所以加起来总共有两个判别器和两个生成器。一个单向GAN有两个loss,而CycleGAN加起来总共有四个loss。CycleG