一部分秋招面经,根据残缺的记忆整理,写的比较简单,供大家参考。之前也参考过很多uu的面经,希望对大家有帮助。好好生活,会有工作的!
常用的评估指标,AUC计算方式、TPR、FPR;
数据量很大怎么平衡AUC计算速度和准确性;
AB实验,目的;
uplift model;
因果推断的假设的理解;
uplift model评估指标;
tree-base 的uplift model;
xgb的优点
了解运筹优化吗;
平时怎么学习算法;
工程实现能力怎么样;
算法题:ip地址组合(回溯)。
项目经历
Transformer结构
transformer为什么用layer norm
transformer qkv怎么得到的
介绍xgb,介绍二阶展开
代码题:1. 动态规划,交错字符串;2. 二叉树的层序遍历。
Transformer positional encoding的方式,为什么用旋转位置编码(序列长度)
因果推断uplift计算
介绍因果推断
attention的计算,为什么要做归一化
transformer加速计算的方法?
介绍常用的优化算法,Adam等
介绍LSTM、随机森林、决策树、SVM
介绍LR模型,它的损失函数是什么,交叉熵怎么计算
bert做mask的方法
positional embedding的方式有哪些
了解文本抽取吗
介绍attention的计算
word2vec
主要问了项目和场景题
AUC计算方式,AUC和KS的区别
word2vec
如何做特征挖掘
transformer的参数量计算
欠拟合的表现,如何解决?过拟合的表现,如何解决
训练集auc下降,测试集acc很低什么原因
训练集auc不下降什么原因
xgb与gbdt的区别
ab实验怎么看显著性是否稳定
等概率和不等概率哪个信息熵大
auc计算方式
过拟合怎么处理
代码题:合并区间
代码题:给一个N*M的矩阵,找出来矩阵中每个位置走到最近的1需要的步数。
AB实验的目的
优化用的什么求解器
代码题:好像是动态规划
代码题:动态规划,机器人走网格求路线,力扣63.不同路径II
XGB的梯度提升是用在树与树之间还是用在树内部的分裂
XGB公式推导,w和叶子结点复杂度的计算公式
XGB为什么用二阶导
求导等于0是求极大值还是极小值,为什么
AUC和KS的区别?
LR的损失函数为什么是交叉熵,为什么不能用MSE
MAPE vs WMAPE
transformer的结构
attention机制的优势和劣势
add&norm中norm的方法,怎么计算
代码题:数组中第K大的数
实习经历
AB实验怎么做,目标、实验做法、最小样本量、实验效果显著性怎么检验,检验的原理,t检验和卡方检验的区别
transformer attention机制
AUC、KS、MAPE的计算方法,应用场景
知道哪些评估指标
GBDT与XGB的区别
sql:当不平衡的数据进行join时,有什么方法提高计算速度
职业规划
有一个数组是AABBBCC,从数学的角度如何去重
指数分布和泊松分布的区别。
python列表和元组的区别
python形参命名两个星号和一个星号的区别
数据结构堆和栈的区别
数据结构如何设计一个哈希表
CNN
RNN和GRU、LSTM的区别
attention的优缺点
xgb和gbdt的区别
bagging和boosting
AB实验
如果AB实验第一周呈正相关,第二周没有关系或呈负相关怎么办
transformer attention机制
transformer在做seq2seq时,静态特征和动态特征输入到encoder后会有什么不同
#面经##牛客解忧铺##你的秋招进行到哪一步了##你觉得今年秋招难吗##我的求职思考#