1面
项目经历+少量8股,项目从motivation 到结果,再到他可拓展的点。8股问了我一点bert 和diffusion,然后开放性回答了一个问题,具体忘记了。coding是手撕transformer,包括mask。
2面
项目经历加少量8股+coding,和一面差不多,也是讲论文讲实习,8股是clip blip 的原理还问了点源码。然后对论文提出了几点质疑。然后问了点并行训练基础。coding Dfs不在hot100内,很久没写这种非常规算法了,写了快30分钟。后面他说应该写dp (
3面
项目经历8股+coding。这一面说是加面。项目论文问的很少,20分钟就结束了。3面好像是交叉面,问了我一堆优化问题,包括手撸ktt 条件,牛顿法拟牛顿法,然后模型并行训练,问了很久,被疯狂拷打,好在基本都还记得。coding是拿列表写cnn,不增加空间复杂度的情况下写出padding 后的结果。
4面
主管面和网上说的聊天聊规划不一样,还是项目+8股+coding。看得出来面试官很牛,全程被爆杀。好在还是混过去了,coding是模拟,数据结构是栈。
Hr 问项目,问体验,问学到什么,问要多少。
这里贴一个我给hr 提的问题,比较尖锐。
问:如何看待商汤脉脉疯狂劝退,公司不盈利的话未来怎么发展。
答: 具体我忘了,hr回答的是商汤目前亏损空缺在逐年减少(这个可能需要评论区大神查一查),大模型是公司的重点方向。公司没有网上传的那么夸张。裁员是结构优化,重点部门是不会裁的。
商汤基础视觉组大模型方向。