面试时间:4月12日15:00 ~ 16:00
先是自我介绍,介绍完让详细介绍一个项目,期间问项目细节。
然后问基础知识:
介绍一下transformer,attention怎么计算,为什么除以根号dk。
LN和BN的区别,以及为什么cv中用BN,nlp中用LN。
self attention和position embedding是直接相加的,那如果变成concat会有什么影响吗(这个答的纬度变化导致计算量变化,但是说忽略维度变化,所以没太明白具体区别)。
问了一下是不是cv中用的是BN。
最后做了两道算法题。
第一题是:
手动实现一个采样的类函数,只能调用random函数,时间复杂度O(logn)。
528. 按权重随机选择
第二题:A同学随机从【1,20】之中选择一个数字,B同学扔3次骰子得到一个和,求A同学数字大于B同学数字的概率
慢慢等结果吧,说我是今天面的第五个,但是组里只招两三个人,大概率凉了