感觉已经凉透了。。。写点热乎的凉经攒攒人品。反馈效率非常3高,只要这轮过了当天就会联系你约下一面,是我面过的最不墨迹的单位
一面
聊一个项目(自己挑)
Deepspeed了解吗
介绍下熟悉的主流大模型(llama)
和transformer有什么区别/改进
旋转位置编码怎么做的
了解强化学习吗
算法题:
1.大小为k的滑动窗口扫描无序数组(步长1),输出移动过程中的窗口最大值
2.最大值栈
反问
二面
聊项目
由项目引申细节提问(项目每个人不一样嘛,所以具体问题的参考意义不大,但可以再确认下自己项目的技术细节):
bert的位置编码设计有什么数学含义?正余弦位置编码为什么2t要除以d?
说一下吉布斯采样怎么个事
算法题:
通配符匹配(hard)
场景题:怎么在一万篇文档里查找50万大小的词典中的词是否出现?
反问
三面
常用什么语言?
Python怎么查字符串在另一个字符串中是否出现?答是find函数
返回值?正常答
底层实现逻辑?(嗯,这话一问出来我差不多知道我算是走远了。。。。)
引申:你自己实现的话怎么实现字符串查找(模式串 母串 不用想太复杂)
从商品描述中抽品牌,要求准确率覆盖率要高
品牌词典大概50万,你怎么做?交流过程中有提到要考虑词义消歧,要考虑挖掘新的品牌词出来
设计程序把物品pair list 同类合并成类/簇list(pair代表成对相关)
反问
总结就是:自己项目必须熟,大模型标配,字符串拉满,如果你有搜索项目经验的话抓瞎程度应该会比我低一些(吧