8.22 全程70分钟,不折磨,略聊天
手撕:
上来直接手撕2题,30分钟,没开摄像头
自己处理输入输出
回文链表判断,升序列表的旋转点
实习:
面试官启动摄像头
拷打业务,使用场景,上线情况,系统设计,难点解决
大模型搜推和传统搜推的区别,trade-off等
八股:
搜推算法:不熟,用的不多,不问了
分类任务统计学评价指标,F1-score等
文章偏CV,自己选一个模型和任务讲讲
手撕Transformer结构,一个个撕一个个问
cross attn的QKV到底来自哪里?(第一遍说对了,哥们给我问不自信坑错了)
为什么要使用位置编码?
Bert和GPT的区别?why gpt decoder-only?训练任务?
反问:
组里业务方向与应用?主要确认一下匹配程度
8.23过