这次第二次一面,上次一面结束后就没消息了,等了将近二十天,觉得应该是泡池子里面了。于是又在官网重新投递的,重新安排的面试。
1. 自我介绍
2. 先问如果面试通过了,什么时候可以来实习,实习可以线下不
回答说往年 6 月初就可以实习,今年的话因为疫情可能要 6 月底才可以线下实习。
3. 问有实习过吗?
没有实习过,现在就是在找暑期实习
4. 简单了解下简历上的两个项目
第一个是实验室的项目,第二个是研一的课程设计。因为我研究生主要在做 NLP 相关的研究,关于推荐只有一个课程设计,面试官好像一直没找到能问的点。
5. 除了这个课程设计,对于推荐还了解哪些
上课的时候做过这个项目,读过一些相关的论文,看过一两本经典的书籍。
6. 介绍下推荐系统的流程
召回 -> 精排 -> 多目标混排
7. 召回和排序比较大的差异点
召回比较简单,要快。精排需要精确排序。面试官说有的召回策略也比较复杂,比如双塔模型,有了解吗?
有了解,分为用户塔和物品塔。这块我了解到用户塔和物品塔都是相对静止的,可能隔天才会更新。但面试官说用户塔也可以做到根据用户的行为进行实时更新。这块了解的不太深。
8. 为啥排序会比召回的结果要准呢?
排序的模型更复杂,用到的特征更多。我了解到的召回策略,协同过滤,关键词召回
9. 项目中 DIN 模型里面的 attention 是怎么做的?score 是怎么得到的?知道原文里是怎么做的吗?
10. 现在主要研究是 NLP 吗?
11. 简历上的在投论文是一作吗?结果咋样
12. 未来是希望做 NLP 还是 做推荐
13. 毕业论文开始写了吗?
不知道为啥问这个问题
14. 实验有做推荐的吗?
15. 大数据相关的技术了解如何?
简历上有写这个
16. 反问
用户意图理解、用户兴趣、画像建模,应用到推荐上
17. 编程题
本科是计算系的,平时刷过 leetcode 吗?
回答说:没有刻意刷过,不知道该如何回答。
判断二叉树是否是镜像二叉树,就是判断是否对称。leetcode 原题
回答说这个题可以用递归和迭代来做,写了递归实现。
结束后,过了一会,说过了,约了第二天的二面。
总结来说,面试官人很好,中间答不上来的,也都有引导,全程感觉很好。
面试时间挺长的,面了一个多小时,但还是挂了。。。。
1. 自我介绍
2. 先问了在投的论文,接受了吗?
感觉这个面试官还是很看重论文的
3. 介绍下这篇 paper
巴拉巴拉,,,,感觉介绍的还是不太清楚。面试官很在意数据,以及训练过程
4. 主观性很强的场景,如何做量化等等
5. 结果 f1 提升的 1% 怎么保证有效性,如何保证置信呢?
实验过程中固定随机种子、多次实验取平均
6. 固定随机种子后,多次实验结果相同吗?
还是会发生变化,问为啥,回答说 gpu 卡不同。。面试官说梯度传播过程,梯度(浮点数)精度有差异,随着神经网络层数的增加,梯度差异会从小数后面的位置往前跑。只能设置浮点数精度增加来缓解这个问题。
7. 介绍下第二个项目,跟推荐系统相关的
8. 结合这个项目,说说自己对推荐系统的了解
召回 -> 精排 -> 多目标混排
9. 多目标混排算法有哪些
面试官想让问答的是 MMOE 这些,但只听说过,不太了解
10. 召回主流的做法
embedding 召回, 局部敏感哈希
11. 召回的目的是什么,推荐系统一定需要召回吗?
这个答的不太好。优化工程耗时,候选池很大的时候,一定需要做召回,跟精排所用的算法无关。推荐系统最大的工程耗时是在倒排索引环节
12. 介绍下 embedding 召回
简单说下了 node2vec, user 的 embedding 通过平均该 user 的浏览记录的 embedding 来获得。 user 的 embedding 有啥改进吗?用注意力机制来做
13. 推荐系统冷启动问题,怎么解决
基于流行度的召回,收集喜好的机制
14. 怎么解决排序结果都是之前电影相似电影的结果
热门电影的排序结果不参与精排,直接随机插入到最终结果中
15. 编程题
最长无重复子数组,leetcode 原题,用滑动窗口来做
被围绕的区域, 牛客上的原题,考场上题目理解错了,写完后经面试官提示后发现是 DFS 或者 BFS
总结,总体感觉面试不难,但是处处又都体现着你对这些知识点的理解。而且很重要的一点,要是编程题没做出来的话,大概率面试就凉了。
虽然面试挂了,但感觉这次面试学到了不少,而且后面又被其他的部门捞了起来,目前还在面试中。等面试结束后,再进行下个部门的面试复盘。
#面试复盘##春招##面经##求面经##美团##算法工程师##实习##笔经#