预训练数据收集流程
隐私过滤是怎么做的
怎么用OCR算法解决读取pdf公式语料以及双栏pdf的问题
预训练数据集构建中的亮点
数据质量评估方式
垂域评测集的构建方式
微调评测集是怎么做的,全参微调还是lora,lora原理
图文模型是怎么做的
没有八股,coding是旋转图像和编辑距离二选一。
全程都是问项目。团子面试体验太好了,面试官情绪价值拉满,就迟到一分钟但还是道歉,全程点头微笑,快比我还礼貌客气,编程题竟然还能二选一,反问的时候解答的也很有耐心。
周五晚面完今天约了晚上二面,过了就卸载饿了么,求团子给个机会吧。
#美团求职进展汇总#