当前位置: 首页 > 面试经验 >

字节电商对话大模型一面

优质
小牛编辑
69浏览
2024-09-03

字节电商对话大模型一面

感觉面试官非常没有面试的欲望,面试也很短,没搞懂。
1. 自我介绍
2.项目拷打
介绍实习项目的背景
从最一开始是怎么做的,怎么考虑优化的?
怎么评估我们最后的模型?
比较好的数据获取方式有哪一些?
除了 SFT 有做 DPO 吗?
DPO 的 loss 是什么?(含含糊糊的描述了一下)
有了解推理加速吗的原理吗?
Qwen2 有哪些提升?
Group Query Attention 是什么原理?
问的很少,半个小时就写题,写 top K。
很快写完了,但是用 C++我的 include queue 写成了 include priority queue,所以显示没有这个文件跑不通。
我问面试官:好像飞书没支持优先队列(我都心虚),能不能自己编译器跑一下给你看?
面试官:不用了,代码就到这里吧。
然后反问
一面就这样,我想着代码题我也不是不会,一般都多少会让我跑一下?他也不要我解释也不看,直接结束。
 类似资料: