当前位置: 首页 > 面试题库 >

请你说一说交叉熵,也可以再说一下其他的你了解的熵

寿卜鹰
2023-03-14
本文向大家介绍请你说一说交叉熵,也可以再说一下其他的你了解的熵相关面试题,主要包含被问及请你说一说交叉熵,也可以再说一下其他的你了解的熵时的应答技巧和注意事项,需要的朋友参考一下

参考回答:

为了更好的理解,需要了解的概率必备知识有:

大写字母X表示随机变量,小写字母x表示随机变量X的某个具体的取值;

P(X)表示随机变量X的概率分布,P(X,Y)表示随机变量X、Y的联合概率分布,P(Y|X)表示已知随机变量X的情况下随机变量Y的条件概率分布;

p(X=x)表示随机变量X取某个具体值的概率,简记为p(x);

p(X=x,Y=y) 表示联合概率,简记为p(x,y),p(Y=y|X=x)表示条件概率,简记为p(y|x),且有:p(x,y)=p(x)*p(y|x)。

熵:如果一个随机变量X的可能取值为X={x1,x2,…,xk},其概率分布为P(X=xi)=pi(i= 1,2,...,n),则随机变量X的熵定义为:img

把最前面的负号放到最后,便成了:img

上面两个熵的公式,无论用哪个都行,而且两者等价,一个意思(这两个公式在下文中都会用到)。

联合熵:两个随机变量X,Y的联合分布,可以形成联合熵Joint Entropy,用H(X,Y)表示。

条件熵:在随机变量X发生的前提下,随机变量Y发生所新带来的熵定义为Y的条件熵,用H(Y|X)表示,用来衡量在已知随机变量X的条件下随机变量Y的不确定性。

且有此式子成立:H(Y|X)=H(X,Y)-H(X),整个式子表示(X,Y)发生所包含的熵减去X单独发生包含的熵。至于怎么得来的请看推导:

img

简单解释下上面的推导过程。整个式子共6行,其中

第二行推到第三行的依据是边缘分布p(x)等于联合分布p(x,y)的和;

第三行推到第四行的依据是把公因子logp(x)乘进去,然后把x,y写在一起;

第四行推到第五行的依据是:因为两个sigma都有p(x,y),故提取公因子p(x,y)放到外边,然后把里边的-logp(x,y)-logp(x))写成-log(p(x,y)/p(x)) ;

第五行推到第六行的依据是:p(x,y)=p(x)*p(y|x),故p(x,y)/p(x)=p(y|x)。

相对熵:又称互熵,交叉熵,鉴别信息,Kullback熵,Kullback-Leible散度等。设p(x)、q(x)是X中取值的两个概率分布,则p对q的相对熵是:

 

img

在一定程度上,相对熵可以度量两个随机变量的“距离”,且有D(p||q) ≠D(q||p)。另外,值得一提的是,D(p||q)是必然大于等于0的。

img

互信息:两个随机变量X,Y的互信息定义为X,Y的联合分布和各自独立分布乘积的相对熵,用I(X,Y)表示:

且有I(X,Y)=D(P(X,Y)||P(X)P(Y))。下面,咱们来计算下H(Y)-I(X,Y)的结果,如下:img

通过上面的计算过程,我们发现竟然有H(Y)-I(X,Y)=H(Y|X)。故通过条件熵的定义,有:H(Y|X)=H(X,Y)-H(X),而根据互信息定义展开得到H(Y|X)=H(Y)-I(X,Y),把前者跟后者结合起来,便有I(X,Y)= H(X)+H(Y)-H(X,Y),此结论被多数文献作为互信息的定义。

 类似资料:
  • 本文向大家介绍请你说一下jmeter相关面试题,主要包含被问及请你说一下jmeter时的应答技巧和注意事项,需要的朋友参考一下 参考回答: Jmeter:Apache JMeter是Apache组织开发的基于Java的压力测试工具。用于对软件做压力测试,它最初被设计用于Web应用测试,但后来扩展到其他测试领域。 它可以用于测试静态和动态资源,例如静态文件、Java 小服务程序、CGI 脚本、Jav

  • 本文向大家介绍说说你对windowing的了解相关面试题,主要包含被问及说说你对windowing的了解时的应答技巧和注意事项,需要的朋友参考一下 展示长列表 如果你的应用会渲染大量的列表数据,我们建议使用一种称为‘windowing’的技术,这种技术下在任何给定的时间内只会渲染一小部分数据列表,并可以减少列表项的重复渲染(即再次渲染已经渲染过的数据)。 react-window和react-vi

  • 本文向大家介绍说说你对Babel的了解?相关面试题,主要包含被问及说说你对Babel的了解?时的应答技巧和注意事项,需要的朋友参考一下 babel是javascript编译器,通过设置presets可以将高版本的js转化为低版本的能够在各大没有适配到最新js版本的浏览器上正常运行,实时编译展示工具:https://babeljs.io/repl#?browsers=defaults%2C%20no

  • 本文向大家介绍请你来说一说协程?相关面试题,主要包含被问及请你来说一说协程?时的应答技巧和注意事项,需要的朋友参考一下 参考回答: 1、概念: 协程,又称微线程,纤程,英文名Coroutine。协程看上去也是子程序,但执行过程中,在子程序内部可中断,然后转而执行别的子程序,在适当的时候再返回来接着执行。 例如: 由协程运行结果可能是12x3yz。在执行A的过程中,可以随时中断,去执行B,B也可能在

  • 本文向大家介绍请你说一说epoll原理?相关面试题,主要包含被问及请你说一说epoll原理?时的应答技巧和注意事项,需要的朋友参考一下 调用顺序: int epoll_create(int size); int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event); int epoll_wait(int epfd, struc

  • 本文向大家介绍说一说你了解的新媒体平台相关面试题,主要包含被问及说一说你了解的新媒体平台时的应答技巧和注意事项,需要的朋友参考一下 该问题有三个层级。 第一是考察你是否知道目前主流平台,其二对各个平台特性的了解,最后要提出目前应聘企业适合做那几类平台,不一定对,但需要有思考。答到这三个层级,基本上就够了。 1)目前新媒体平台的可以按照多个方法进行分类,比如类型,用户量级,甚至是按BAT系列。 综合