当前位置: 首页 > 面试经验 >

23届秋招算法岗面经分享

优质
小牛编辑
81浏览
2023-06-26

23届秋招算法岗面经分享

写在前面,楼主是23届硕士,秋招过程中在牛客上收获了很多宝贵的经验,也认识了很多热情的小伙伴,现在马上24届就要开始秋招了,这里我也来分享下自己的面经回馈牛客吧。

大家如果有什么想问的尽管在评论区留言,也可以向我私信,我都会尽量回复的~也祝大家都能有满意的offer~

技术面基本流程

  1. 自我介绍(两分钟足够了)
  2. 讲论文/项目/比赛/实习经历(要有层次,建议讲的过程中可以适当和面试官进行互动)
  3. 基础知识(你自身研究领域/机器学习/深度学习/编程语言,一般来说,如果你实习和论文很丰富就不会涉及基础知识了)
  4. coding(面试时讲究的是快准,要足够熟悉,否则一紧张最基础的都可能写不出来)
  5. 反问

背景

lz是9本C9硕,有两段个人感觉含金量不高的算法实习,一篇很水的论文,力扣代码刷了六七百道,对于各种题型中的高频题目刷了很多遍,面试代码基本上都写出来了,笔试就看运气了。

因为一些个人原因没怎么参加秋招,以下大部分面试基本上都是秋招补录和春招时期,所以存在一个公司面两次的情况。

360-广告

一面

  1. 实习内容
  2. 二分类建模过程
  3. mse和交叉熵用于分类的区别
  4. 假如随着迭代的过程,模型结构越来越复杂,特征越来越多,但是效果一段时间后下降了,请问是什么原因,该怎么解决
  5. 过拟合怎么解决?
  6. 怎么进行特征选择?
  7. 两道题:最长上升子序列(求出具体序列)、背包问题lc322

二面

  1. 随便闲聊了下,问了下实验室做的东西,本来一开始说要写题,结果也没写

hr面

  1. 常规问题,HR说要十一月中旬才有结果。。。

百度-NLP强化学习

一面

  1. 论文、实习
  2. 进程和线程区别
  3. GNN和GCN区别
  4. yolo和FasterRCNN区别
  5. 代码:最大子数组和

二面

  1. 论文
  2. 实习,讲完了啥也没问。
  3. 剪绳子。
  4. 没反问

三面

  1. 问了下对我这个领域应用难的看法;
  2. 做research还是业务,选择哪个方向
  3. 反问

腾讯-cdg广告

一面

  1. 实习内容
  2. 介绍精排
  3. LR为什么用交叉熵
  4. 还有一些基础记不清问的啥的
  5. 代码题二选一,好像是全排列?

二面

面试官没安排好。又是一面的面试官,于是临时拉了个人面。。。只是大概问了简历和一些问题,最后一道很简单的题。lc448。

最想去的地方挂了,唉

美团-内容理解

一面

  1. 论文、实习
  2. 了解CV还是搜推多?讲一下DIN DIEN
  3. 介绍一下attention、transformer
  4. 代码:二叉树层序遍历

二面

  1. 论文
  2. GNN和graphsage区别
  3. mind和DIN区别
  4. 代码:重排链表

hr面

  1. 半小时,常规问题,记不清了。。。
  2. 期望薪资报高了?后来给我加面了

加面-四面

  1. 论文和实习
  2. 一道代码,很简单的二分查找

字节-电商广告

一面

  1. 论文
  2. 常规八股:bn、resnet、dropout、
  3. 了解什么cv模型,讲一下senet,
  4. 过拟合欠拟合,
  5. 了解什么搜推广模型,讲一下DIN,
  6. 代码:给定正整数数组nums,求积小于k的连续子数组的个数。例如nums=[10, 5, 2, 4, 1], k=100

二面

  1. 论文实习
  2. 代码:斐波那契额数列变体,f(n)=f(n-1)+2f(n-2)+3f(n-3),(开始出的没有这些系数,我说了下思路后面试官问我是不是写过,就改了下系数),要求时间复杂度小于O(n),其实就是矩阵快速幂写法

三面-未面

HR二面当天说通过了,结果过了一天说没有hc了,给我转到隔壁部门了

字节-非闭环广告

一面

  1. 论文、实习
  2. 怎么衡量召回效果
  3. 增加一路召回后,怎么衡量这一路的效率(性能和成本)?从召回本身的roi怎么评估?
  4. 代码题:lc68

估计是对我经历没啥兴趣,但看我代码写出来了,又继续问八股了。。。

  1. 介绍DIN及其中的激活函数、din中有个过拟合的设计介绍一下,这么设计的优点
  2. 直接学习不平衡的数据,这毕竟是一个真实分布,会有问题吗,从机器学习本身的原理上来说,或者说不处理是为了解决一个什么问题、可以从梯度下降的角度思考一下
  3. 过拟合的方法(提到了bn)
  4. bn为什么能过拟合,怎么用bn解决过拟合,也就是怎么调bn
  5. attention,LHUC(Learn Hidden Unit Contribution)
  6. 会sql、hadoop吗

反问建议和评价:了解的东西比较多,包括很多东西说的整体上也是对的,但是不能想当然,要把更多更细节的东西展现出来,算法具体哪一步有用。

另外说我召回评估这块没讲好,我说实习组里权限没字节这么大,面试官就说组里的限制不影响你个人的思考,可以秀一下你自己的思考(好吧,确实面试官比我厉害)

最后结果也不出意料,挂了

字节-tiktok推荐-实习

找不到工作。。。只能试试实习了,当积累面经了

一面

  1. 实习
  2. dropout、过拟合解决方法
  3. 论文
  4. 了解什么backbone?提到了mobilenet、shufflenet、senet、vit相关的
  5. 讲一下senet
  6. 代码:pytorch实现senet、找第k大的数(面试官看我写的很快,说背的很熟啊,哈哈哈)
  7. 反问

二面

  1. 问了论文和实习,没八股。
  2. 代码题:找每一层最左边的节点,无反问

三面

  1. 一上来就说面试时间大概45min,先考核代码和数学能力,然后有时间就问下项目
  2. 两道代码:斐波那契额数列快速幂版,rand3实现rand7(调用次数期望值怎么计算,具体计算过程)
  3. 后面问了下实习最深刻的印象、为什么去这些实习、几月份答辩

还以为能过呢,结果后来问了下hr才发现当晚面完秒挂。。。

蚂蚁-商家开放技术部

一面

  1. 论文(面试官竟然了解我这个领域的一些论文,我很激动的和他探讨了下目前的研究现状)
  2. 实习
  3. 代码:编辑距离

不明白为什么挂了,后来找人问了下面评,说是基础不行,可是并没有问任何基础八股问题啊??

阿里-大淘宝

一面

面试官给我的感觉是技术比较强,实习和项目一点没问

1.线上线下效果不一致怎么排查?怎么进行特征选择?假设明确问题是特征泄露,假设问题出在100个特征,该怎么找出导致效果不好的特征?

2.了解BN吗,参数量是多少,有什么用,训练时和测试时的差异,测试时该怎么做,训练时用滑动平均还是单纯用单个batch数据进行bn?

3.两阶段的训练模型,类似stacking,第一阶段输出作为第二阶段输入,假设第一阶段训练得到的数据分布不太稳定,或者说和第二阶段的不一致,该怎么解决这个问题

  • 比如说,旁边组同学模型的输出会作为你的模型的输入,他的模型每天都会更新,这就导致这个输入分布一直在发生变化,这个时候你的模型就需要一定的适应时间,最终的输出根据你的模型决定,这个时候该怎么做,保证你的模型输出尽可能准确

4.最近有跟进什么最新的论文吗,有什么想法让你眼前一亮,讲一讲

5.代码题:给定一个数组,要求将其打散。滑动窗口内(大小为4)不能有元素重复,即模拟用户看到的一个展示页面没有重复,

  • 如果窗口内发现重复元素,则往后探测一个合适的元素与当前元素交换。尽可能不改变相对顺序,
  • 如果不能打散,就把剩下的数全部添加到结果中

输入:[1,2,3,1,3,4,5,6]

输出:[1,2,3,4,1,5,3,6]

二面

  1. 问了论文,也没讲全就被打断了,感觉面试官不在意
  2. auc物理含义
  3. 假设已知auc值,现在新加一批打分为0的负样本,auc值怎么变化?我开始说变大,他说不对,然后我就说不变,面试官还是说不对,叫我回去再想(面完复盘觉得应该就是变大?)
  4. sigmoid激活函数为什么造成梯度消失?(我说输入值太大或太小会导致落入梯度为0处,面试官说不对)
  5. 代码题,实现set(i,index),get(i),setall(val) O(1)时间复杂度。(期间面试官还掉线了,但是我看的是代码界面,没关注会议界面,后面才发现我讲了半天他都没听到)
  6. 问我有哪些offer

百度-商业化

一面

  1. 论文和实习
  2. 代码:求两个数组的交集(如果是有序的呢?)、最大子数组和、pyspark题:求一个月内连续登录三天的用户(大概说了下思路,面试官说不是很重要,就没写了)
  3. 讲一下xgboost,过拟合设计
  4. 梯度消失、梯度爆炸怎么解决
  5. CNN的特点

二面

  1. 实习
  2. 一道很简单的概率题
  3. 然后三道题:
  • 怎么判断n是否能被7整除,不能用除法和求余(二分);
  • 验证完全二叉搜索树(lc958);
  • 两个1GB的文件,每一行存了一个单词,每个单词小于16kb,现在内存1MB,磁盘500G,求两者的交集并输入到C(分治+哈希即可)

4.如果用户输入了一个有错的query,怎么进行纠错,怎么衡量纠错完的质量

三面

  1. 闲聊,对自己5-10年规划,方向选择等等问题
  2. 实习最大的成长,讲一下实习,做了哪些优化,实习的组那边怎么样
  3. 论文创新点
  4. 开放性问题:百度搜索结果页广告,和谷歌广告,从用户和广告主角度看怎么样?其实谷歌广告多很多,那为什么给用户的感觉是百度更多广告,且体验更不好,可以做哪些优化

知乎-推荐算法

一面

  1. python基础:深拷贝、浅拷贝、多线程、生成器迭代器
  2. 分类和回归常用loss、优化器、激活函数区别
  3. 聊实习
  4. 代码题:lc213
  5. 介绍一下WDL,各自作用,去掉Wide可以吗
  6. 介绍一下召回排序链路,哪一个最重要

二面

  1. 随便聊聊论文
  2. 了解排序算法吗,时间复杂度,python排序库函数原理是什么
  3. 了解重混排吗,介绍一下
  4. 代码:检验二叉搜索树

后来面完和二面ld聊了很久,ld人很好诚意很足,可惜最后还是没去

快手-ytech推荐算法

一面

  1. 自我介绍,先写两道题,两个栈实现队列、二叉树根节点到叶子节点的路径(自己建树)
  2. 写代码时间有点长,后面没多少时间了,就问了下实习和论文,有点赶,叫我挑重要的说
  3. 然后八股,问了个梯度消失、梯度爆炸咋办。

二面

  1. 问实习和代码问了好久,感觉确实是比较有水平的,拷打了很久我的论文
  2. 代码题:删除数组中重复的数字
  3. 反问:面试官好能讲。。。。

三面

被拷打了实习,聊什么是自监督,自监督的做法、为什么有用,最新的趋势是什么

假设面试官是个从来不懂计算机的外行人,该怎么解释自监督的原理和做法?

  • 从有监督、到无监督怎么做的,一步一步说的。举猫狗的例子,然后自监督是否能应用到这个任务中?然后我举了个文本生成的例子:完形填空,模型怎么设计,输入输出是什么(其实就是word2vec的原理)。讲了很多,讲完这部分面试就到四十多分钟了,还给面试官画了图。

b站-搜索

一面

  1. 实习项目、论文
  2. 冷启动怎么做、线上配额等等
  3. 介绍一下transformer、BERT、GPT
  4. 介绍一下FM、WDL、DIN
  5. 代码题:移掉k位数字,lc402

二面

  1. 自我介绍、论文、实习
  2. 两道题:lc141、lc40

三面

  1. 论文、实习,然后引申问了些问题
  2. 无代码

美团-外卖推荐

后来春招又投了,结果二面完和我说之前拒过就不能发offer了

一面

  1. 讲一下研究生期间做的这个领域
  2. 线上流式学习怎么做
  3. 交叉熵公式,能不能log内外反过来
  4. 蒸馏loss形式、梯度推导
  5. 讲一下实习。
  6. 线上线下怎么评估召回结果,透出率?
  7. 了解什么模型?DIN激活函数怎么做的,为什么有用,attention的输入是什么
  8. cv nlp这块了解什么,transformer的decoder结构讲一下,有动手实现过吗
  9. 代码:lc97

二面

  1. 论文
  2. 假设有个主场景(很多数据),另一个小样本场景(比如抢购场景),两个场景实际上是有一些差距的(比如抢购场景折扣大、有自身的特效),那怎么用增量学习来解决这个问题呢(提到了PPNet)
  3. 抢购场景用户数量少,用PPNet怎么对少样本进行学习呢
  4. 抢购场景都是一些新商品,也存在主场景中,但是价格不同,库存不同,导致其ctr cvr和主场景不一样,也就是数据分布不一样,这种情况怎么处理。而且抢购场景售卖时间短,通过数据积累和特征的方法是做不了商品推荐的
  5. 如何评价知识蒸馏中student和teacher的差异性和共性
  6. 假如在召回中,用召回模型蒸馏粗排模型,如何评价蒸馏模型的效果,从知识蒸馏角度没有独特指标是吗
  7. 实习怎么构建的图网络
  8. 平时通过什么方式学习新知识,
  9. 对搜广推哪个模块比较熟悉,
  10. 代码:给定一个数组,对每个元素分别找到其左边、右边第一个比它小的数,对每个数返回一个索引对。

商汤-大模型

一面

  1. 论文,实习
  2. bn作用,ln作用
  3. 怎么判断链表是否有环,慢指针最多走多少步(假设有n个节点,最多走n步)

二面

(顶着38 39度高烧面试,但其实面完感觉人更舒服了一点)

  1. 检测中的增量学习难点
  2. 检测中怎么进行蒸馏
  3. cnn和transformer区别
  4. 在cnn和transformer之间进行蒸馏的难点
  5. 讲一下self-attention,具体怎么计算
  6. softmax运算过程,有什么问题(溢出),怎么解决
  7. bn和ln区别,bn具体怎么计算,训练和测试时差别

三面

  1. 两道题,快速幂、lc528
  2. 反问的时候面试官信号太差了,一直断断续续,几个回答一个没听明白,又不好意思叫他再说一遍。。

hr面-电话面

lazada-用户增长

一面-没开视频

  1. 论文、实习
  2. auc效果提升,但是gauc效果不变甚至下降是为什么?
  3. MMoE中很多expert gate的权重变为0怎么解决?比如只有对某个expert是激活态,其他都是0,那其他expert可能压根学不到信息,该怎么办
  4. 代码:岛屿数量、接雨水
  5. 反问(面试官很热情的和我介绍,当时心里还以为过了)

两个八股答的一般吧。。哎,挂了,这也是我最想去的地方。。。

快手-社科推荐

一面

  1. 自我介绍
  2. 代码题:求2的根号,精确到小数点后四位。要求二分法、梯度下降法、牛顿法,写完问还了解其他优化方法吗
  3. 知识蒸馏目前的做法?讲一下,有什么优缺点,讲了很久很细。
  4. 知识蒸馏loss?温度系数
  5. 了解什么推荐内容?把整个链路说了一下
  6. 探索和利用怎么做?讲一下汤普森采样,期望和方差对应什么参数
  7. 冷启动怎么做?PPNet具体做法?
  8. 实习
  9. 论文

二面

  1. 实习项目,讲了四十来分钟,一步一步写伪代码和过程
  2. 反问

三面

  1. 实习
  2. 论文
  3. 知识蒸馏在cv nlp和推荐中的区别
  4. 代码:lc148,我用归并排序实现,写完又问我快排怎么实现?

四面

  1. 实习,各种问题
  2. 找二叉搜索树中最接近target的节点(先写了bfs,然后写dfs)

hr面

  1. 一些常规问题

小红书-信息流广告

一面

  1. 代码:快排、最大乘积数组
  2. 论文、实习

二面

  1. 论文、实习经历
  2. 实习组内推荐系统最大缺陷是什么,或者做的不好的地方有哪些,该怎么改进

HR通知说过了,结果不知道为什么一直拖着不约三面。。。。后来我也懒得管了

阿里UC-推荐算法

一面

  1. 论文和实习大概讲了下
  2. 代码:(1)合并区间(2)实现树(3)求树的最大直径
  3. 数学题:m个红球,n个蓝球, 有序的选7次,求可选次数,m、n > 7
  • 1)同色球可以区分;2)同色球不可区分;3)蓝球不可连续选

二面

  1. 本科课程,数据结构,了解什么排序,时间复杂度各是多少
  2. 研究生课程,介绍一下模型,FM、WDL、DIN,youtube召回模型,优缺点
  3. 实习,实习收获

hr面

  • 常规问题,忘了

后来没接到HR电话,也打不回去。只能找约面的联系人,说帮我询问一下,结果一看官网流程就给我立马挂了。。。。果然不缺人

滴滴网约车mpt

一面

  1. 论文、实习
  2. 线上线下分布不一致是为什么,怎么解决
  3. 了解什么激活函数,sigmoid特点,relu呢?怎么改进
  4. L1L2正则化为什么有用
  5. auc曲线,怎么画
  6. 权重初始化
  7. spark和hive区别(mapreduce)
  8. 怎么找多个数中的第k大数,时间复杂度(口述)
  9. 代码:复制带random指针的链表,lc138

二面

  1. 实习
  2. 代码:找中位数
  3. 反问(面试时间不长)

三面

  1. 论文、实习
  2. 排序有什么指标?ndcg怎么计算的,其中的d是什么
  3. 怎么理解偏差和方差,怎么减小方差,bn为什么能减小,正则化是减小还是增大偏差
  4. 代码题:最小路径和,O(1)空间复杂度做法

四面

  1. 还是技术面,忘记记录了

hr面

  1. 常规问题。忘了
 类似资料: