难度挺大的,做完不能不回头看 一、单选: 1、float==double:float会被转成double,即便如此,仍有可能返回false 2、AdaBoost算法确实会加大此前决策树(或其他弱分类器)分类错误的权重,使下一个模型尽可能正确,所以依赖之前的模型; 3、GBDT(Gradient Boosting Decision Tree,梯度提升决策树)是一种集成学习方法,它通过迭代地构建决策树
算法岗 1. Lora原理 2. qwen词表大小 3. deepspeed原理 4. zero原理 5. 讲一下transformer结构 6. 有哪些Encoder-Decoder结构模型 7. multi-head attention原理 8. 讲一下Stable Diffusion 9. SD中,controlNet怎么结合进来的 10. 大模型的训练流程 11. clip原理 12. 为
8.29 一面 50min 1.拷打论文 (面试官反馈,讲的很清楚) 2.拷打实习 3.LoRA原理 4.对Seq2Seq模型的理解 5.self-attention原理 6.位置编码,LLM用的是什么?为什么这么设计? 7. RAG了解吗?讲下RAG链路?RAG为什么有用? 8. RAG向量召回怎么做的? 9. 手撕——删除链表倒数第n个节点(从class开始实现, 有个地方有bug, 不过面试
技不如人甘拜下风 5道题 1.签到题 两辆火车车尾对齐出发,长的长度为d1,短的长度为d2,长的慢,速度为v1,短的快,速度为v2,求什么时候车头对齐 就是(d1 - d2) / (v2 -v1) 只需要调整输出的格式,不过只记住了cout.setprecision(),知道还需要一个东西(fixed)但忘了是啥😅 死活想不起来后灵机一动,用牛客自动补全,在cout后面所有跟的东西里找到了fix
真的没面过这么无语的面试,雷点太多。 1.面试官迟到,还要候选人自己call。 2.面试官不开摄像头。 3.介绍实习工作时,我想共享ppt。一般来说都是鼓励你图文并茂展示的,结果他一来就说不要用这种第三方资料,真的无大语。 4.我工作说完没有任何要问的东西,都没有认真听,就开始问我有没有做过diffusion相关工作。(大哥我的简历清清楚楚,所有的论文和技术栈都写了)然后我说我做的几个任务学术界并
时间:90min 1.单选题10道(50分):涉及机器学习、数据结构、概率论等 2.编程题3道(90分) a)(20分)把一个数列拆分后,判断得到的数列是否可能为原数列 b)(30分)套了很多箱子([[]3]代表1个大箱子里放了3个小箱子共有4个箱子),输出箱子的数量 c)(40分)给一个数组,有多少个索引对满足题目条件
先说总结,体验极差,断网声音小面试迟到。 约的上午9:45一面大概十点才来。 十点人来了,一个hr一个技术人员,之后断网,这是我的问题暂且不说,但声音真的好小,音量已经开到最大了还是外音,趴上去听都担心听错。之后开始正式面试: 1你家是河南的,意向城市为郑州,来济南如何? 2你的网不好,可以调调吗? 3期待薪资多少? 4介绍下你具有代表性的一个项目 接下来技术面开始: 1超长上下文咋办 2tran
1、自我介绍 2、两个科研项目的深度拷打 3、手撕一道力扣原题,无重叠区间。(没a出来,痛苦!)面试管人很好,给我一些引导,但是思考太久了就结束了。 一开始用C++写,发现sort算法的第三个参数写不出来,太不熟练了。然后换python,写出来一半 4、反问 5、问问能实习多久,想不想转正 下周出结果,要是能做出来机会就大一些了,奈何自己不争气,刷题太少了,痛失珍贵的机会。后面把时间都用来刷题吧
总共面了不到半个小时,不知道是不是KPI面。 自我介绍 提问: - 论文创新点 - vit - transformer的全局依赖是怎么做的 - 自注意力的Q,K,V的物理意义 反问: - 业务 - 建议 - 后续流程(不太清楚) 一面完后续面试还有技术面吗?
问了bert模型原理 问怎么实现的 因为投的是ml/数据挖掘/nlp一起的岗位 但其实面我这个部门的面试官是做nlp的。。。就完全不怎么match我自己也没有什么nlp的经验 (bert没答上来 一脸懵逼) 然后问了项目中lstm交易数据是怎么预测的 输入和输出分别是什么 (答得不对 我说了时间 面试官说时间预测不了应该是价格。。) 然后项目中写了自己会一些前端的东西 被拷打 怎么实现居中 fla
多模态深度学习方向 问一些论文、项目相关 深度学习基础知识 过拟合解决方式 L1,L2正则化 BN层和过拟合的关系 算法题 给定字符串,删除最少的左括号和右括号,使得字符串括号能一一匹配 思路:从左到右扫描,遇到左括号入栈,右括号出栈,栈空时遇到的右括号直接删除,记录需要删除的字符位置 可能要去看一些多模态大模型相关的工作,了解很少,被问到有点尴尬
背景:自己做的是算法部署 四十五分钟 主要拷打项目和实习所做的东西,聊了很多模型部署的工作 八股量很少,问你对NLP熟不熟悉,就NLP 大模型 关键词聊了一些,BERT transformer NER啥的,答的一般 最后介绍部门情况,说其实我们这边主要是算法设计,不是很偏部署,但是校招主要是看潜力,要是进来了能不能接受转方向
6.26一面: 1.自我介绍 2.介绍论文(数据集,输入,输出,模型架构,评测指标,创新点,motivation) 3.transformer比rnn/lstm这些有什么好处?除了并行计算还有呢 4. decoder和encoder有什么区别 5. QKV怎么来的,除了selfattention还有什么attention? 4.prompt为什么在大模型中起作用 5.手撕:查找有序数组中小于k的最
一面6月15号下午4点一个小时 讲比赛,瞎聊 梯度下降求平方根,力扣只有二分和拟牛顿写法,写了好久靠面试官提示写出来了。。 def sqrt(y): xt=0.0001 l=0.001 thresh=0.001 while abs(xt*xt-y)>=thresh: loss=1.0/2*(xt*xt-y)**2 dx=(xt*xt-
6.14一面 6.17二面 (其中6.16下午发短信通知6.17上午二面,间隔也太短了) 一面技术面,项目聊的比较浅,问题也比较八股,甚至没让开视频,很快就结束了 看网上大家分享前两面都是技术面,但是今天二面直接就变综合面试了,没聊什么具体的技术,就是乱七八糟的聊一聊,遇到什么困难怎么解决的,整个过程也很短。 感慨一下tp的面试也太简单了,速度也很快,前一段找实习面的各种厂被拷打麻了