没有笔试,直接一面,一开始面直接就感觉凉。基础不好压力真的很大。
- [ ] 自我介绍,拷打项目,实习
- [ ] 为什么DeepFM的FM测会导致过拟合?
- [ ] DeepFM的LR测有什么作用?
- [ ] 为什么双塔模型不适用于排序?
- [ ] 实习业务用什么优化指标,为什么不用CTCVR?
- [ ] 实习业务做了哪些特征工程,有没有探究特征重要度?
- [ ] 精排模型离散数值是怎么嵌入的,图片聚类特征怎么嵌入?
- [ ] 怎么做热门广告创意相似度召回?
- [ ] 对于样本中的长尾效应,除了样本采样,怎么修改模型结构优化?
- [ ] 物料特征选用物料ID好不好?用户特征使用用户ID呢?
- [ ] 商业流量实验排期怎么做
- [ ] 实习业务的EE策略,UCB推导,Greedy Epsilon推导,物料冷启准出策略置信度怎么计算的?
- [ ] 懂AIGC吗?智能广告创意是怎么生产的?讲讲DALL-E
- [ ] 实习公司日活怎么样?不同广告位CTR如何
- [ ] 八股
- [ ] 什么是梯度消失?为什么Sigmoid激活函数导致梯度消失?
- [ ] 残差结构是什么,残差结构为什么能解决梯度消失?
- [ ] RNN里为什么会梯度消失
- [ ] 讲一下 transformer
- [ ] transformer为什么可以并行?transformer在Decoder端怎么并行
- [ ] Transformer为什么用三角函数当作位置编码?用index不行吗?
- [ ] transformer相较于RNN,性能方面为什么会提升?
- [ ] transformer decoder端位置掩码是什么
- [ ] BERT位置Embedding和位置encoding的区别是什么