地图出行服务业务部-T联合 (一面已凉
投递时间:7.11(第一次投递的挂掉了)
变更岗位:7.26
测评邮件:7.26
面试时间:7.30 15:00,挂得很快,吃完饭回来就挂了
总时长:80min,其中项目40min
1、之前在百度做的岗位信息爬取和我的论文有什么关系,为什么离职了?
2、论文里的损失解释一下,设计的模型是微调的 or 预训练的?
3、比赛是自己做的还是组里合作的
4、transformer相关的模型了解哪些,比如bert等
5、Q * K^T 为什么除以 sqrt(d_k),为什么不直接除以d_k,为什么不除以 d_k 的1/3次幂
6、Q、K、V一般怎么初始化,有试过初始化为全0或全1吗
6、layernorm 和 batchnorm什么区别,transformer里可以用batchnorm吗
7、怎么解决过拟合?我:数据增强和正则化。面试官:数据如果足够多了就不存在过拟合了吗?:…
8、dropout 是什么,有什么用?
9、常用的优化器?Adam有什么优点?
10、boosting系列算法了解吗?:了解XGB和LightGBM,我不常用,简单说了下区别
11、Llama里的旋转位置编码和绝对位置编码什么区别?如果序列很长应该用什么编码方式?
12、奥卡姆剃刀了解吗?我:不了解,老师没教
13、经验风险了解吗?我:不了解
14、预训练模型的输出是512,下游任务要1024的怎么办?面试官主动找补:你没做过预训练可能不了解
15、浅显易懂地讲一下AUC,最好的AUC曲线应该是什么样子
Code
1、快排(太尴尬了,看到别人的面经里有快排了但是忘了复习!!!!于是写了个冒泡,说我不记得快排了(尬笑.jpg),面试官:哦...
2、(可能看我快排没写出来,又问了一个)手写sqrt(n),n>=0,要求精度在 e 以内,我写了个小数二分
反问
1、进组的话要做什么方向
2、平常工作更倾向于算法研究还是产品研发
#百度求职进展汇总#
#提前批##百度秋招提前批#