电话面+邮箱发alitcode链接进行coding考察
-----------------------------------------------------------------------------------------------------------
没有让做自我介绍,直接对着简历问项目。
第一个项目是用seq-to-seq做的缺陷自动修复,问我将NLP应用到软工领域有什么痛点。
第二个项目是基于代码大模型做测试生成,介绍完整个过程后没有扣细节问题,又问了AI4SE的基本切入点,我说我做的工作找到一个有代码生成能力的模型是重点。再接下去确定我们领域的工作落在怎么用好模型,而不是开发出模型。
-----------------------------------------------------------------------------------------------------------
然后因为我简历上写了本科课程中有深度学习和机器学习,于是问了我这两门课都学了什么,但是好像没有达到面试官预期的深度。
开始机器学习八股,问我对集成学习的了解。我说了bagging和boosting基本原理(非常非常浅)。然后问我哪种集成学习的泛化能力更好,搭不上来,猜了boosting。结果面试官人怪好的,就集成学习给我上了一课。
-----------------------------------------------------------------------------------------------------------
开始coding,只有一题。
H 指数
可惜没刷过,我一开始用了一个排序的算法,不过也只写出个大概。
然后面试官让我不排序做一下,做不出来,给了我提示,我还是不太清楚。
-----------------------------------------------------------------------------------------------------------
反问环节
因为我对集成学习了解特别少,感觉面试官又很乐意布道,所以我问了问什么情况用,听完对XGBoost,LightGBM有兴趣了。
面试官说他觉得技术细节不是很重要,问我有没有其他问题,我问去蚂蚁是否需要具备较强的业务知识。
-----------------------------------------------------------------------------------------------------------
五十几分钟结束。
#机器学习算法面试#