1.SyN算法(微分流形) 2.梯度下降 求y=x^2的最速下降(一阶) 3.Rest-Net 结构encoder和style Encoder 4.解决错误变形的方法
时间:晚上10:16左右,20分钟左右 面试官男,非常疲惫,每次我回答完问题都沉默了很久,声音也很疲惫。 1、问学校,学位证,毕业证 2、项目经理(sd、lora、fine-tune过程) 3、L2正则化解释一下 4、用过BN(batch normalization)吗? (答了梯度消失的时候的最佳解决方案,顺便扯了梯度消失的时候换激活函数,实际上还有梯度爆炸也可以用) 5、用过Dropout吗?
一面一上来先做了道栈的原创题,之后就是问项目,主要是数据部分。 第二天约的二面,二面是纯聊项目,压力非常大,堪比商汤的三面。对方应该是一个领导过一个大型基座模型分布式训练项目的leader。 从一个垂域大模型从零开始的数据收集,清洗,评估,增强, 到模型的训练,评测,微调策略,scalinglaw实验, 到分布式训练,4D并行,节点通信,坏点检测, 再到算法上的decoder only,atten
预训练数据收集流程 隐私过滤是怎么做的 怎么用OCR算法解决读取pdf公式语料以及双栏pdf的问题 预训练数据集构建中的亮点 数据质量评估方式 垂域评测集的构建方式 微调评测集是怎么做的,全参微调还是lora,lora原理 图文模型是怎么做的 没有八股,coding是旋转图像和编辑距离二选一。 全程都是问项目。团子面试体验太好了,面试官情绪价值拉满,就迟到一分钟但还是道歉,全程点头微笑,快比我还礼
bg和前两次面经可以看动态 9.21上午收到线下终面通知,约的9.23下午2点,面试地点在哈尔滨一栋写字楼内,迈瑞包下了其中一整层,不过里面看起来空间不大,也没有各种研发用的设备,应该只是迈瑞在哈尔滨的一个办事处 简单进行自我介绍,然后开始唠一些个人情况,感觉更多是像性格测试?面试官也直说了就是走流程,全程人也非常nice,语气很温和,时刻保持微笑,有问必答,体验很好 以下有些问题记得不全,差不多
8月底投,昨天给1面通知,今天10点约面 bg 双末9,做医学信号+ai这块 论文情况一篇中科院q2录用,一篇b类q1在投 一面30分钟,用ppt做了自我介绍,但因为是秋招第一次面试说得有些磕绊,感觉不太好 高强度拷打项目经历,各种细节问得非常多,反而没问半点论文,没有各种八股问题和手撕代码环节(不排除之后有) 最后问了些个人简单情况,base意向,有无女朋友之类的,还投了哪些企业,工作选择你比较
一面 时长:1h 1.自我介绍 2.项目拷打,其中提到了常见的激活函数 3.手撕:self-attention,写完代码后根据代码问问题 1)bert中随机mask了一些词,在代码中是如何体现的 2)代码中e的x次方特别大的时候,模型不是很平滑,这个时候怎么处理? 3)你那样处理为什么不会影响最终的结果? 反问 1)部门业务?直播的图文生成,内容理解 2)看重校招生的什么能力?思考能力和学习能力
昨天上午一面面完,当天下午通知今天二面......效率奇高,bg和一面可以看之前的帖子 下午两点半开始,二面30分钟,吸取了一面准备不足的教训后重新调整了ppt,准备了演讲稿 开场先常规的自我介绍,ppt+演讲稿=自我介绍如鱼得水,建议没有准备的🐮友们速速准备下 然后围绕论文和项目开始问,论文问了一些实现细节和相比其他方法的优点,怎么想到的方法等等 项目相比一面基本没怎么问,简单问了下是
整体25分钟,综合面 1.自我介绍 2.问我获得十佳研究生是学校哪个部门评的、什么依据、我的优势是什么,还问了一些我国家奖学金之类的荣誉的评选细节,感觉这种所还是挺看成绩和荣誉的 3.问我比赛相关的,让我挑出来一个认为做的最好的比赛、然后问我在里面的角色、遇到的最大困难、如何统筹队伍、如何激励队员、如何分配奖励,这块还问的挺细的 4.问我为什么想来30所,我就说成都好、30所是比较好的选择等,问我
整体22分钟,这轮是hr面,她说通过的话还会有一轮主管面 1.自我介绍 2.问我实习相关的,问我实习有什么感觉,我说了一下网易这边的实习,然后和小米做了对比;问我期待的工作氛围是什么样的,我说了一下;问我实习做项目和在学校做项目有什么不一样,我就说了一下 3.问我对汇川有什么了解,我说了之前在官网看的,然后又搬出汇川杯大赛,夸了汇川一波 4.问我的职业规划,我就说了一下不想去互联网,想去和实体产品
题型为单选题3*10=30分 不定项选择题5*6=30分 填空题4*5=20分 编程题10*2=20分 考试为牛客题库,双机位,我没有手机支架随便找了两本书把手机立起来。 可能是因为时间只有1h的原因,所以题目本身没有特别难的。选择题基本上都是关于排序算法、搜索算法、数据结构、数学建模(主要是优化问题)、常见的控制算法(考了一道关于模糊控制的)等。主要还是以算法为主,没咋考现代控制工程,经典控制理
1.自我介绍 2.项目拷打 3.实习拷打 4.微调的显存需求,如何估算?经典的Deepspeed举例 5.deepspeed 原理 (ZeRO三阶段、offload) 5.多标签文本分类,怎么选大模型,loss怎么设计(不太会传统的NLP任务,每个文本可能有多个标签,只回答了一个交叉熵损失) 6.z字螺旋矩阵生成(感觉不能叫螺旋矩阵): 具体为给定一个正整数N,生成下面形式的NxN的矩阵 N=4为
在boss直聘找工作,最早最快来的是本家的面试23333 自我介绍 第一份工作的规划 讲项目,打开ppt讲了。中间问了一个为什么简单的检索在项目里就很有效(我这边的是有参考文献的结论回答的) 问:最近大模型的趋势,发展方向自己的理解 然后讲一个自己比较了解和喜欢的llm技术,我讲了rope 问:应对超长的输入,llm怎么处理,以及有什么难点 还有看过什么最新研究吗,这个我确实没看 问flash a
全程40分钟 1.自我介绍 2.让我讲一下实习经历,我做的智能npc,主要先讲了一下数据处理和探索,然后讲模型全参微调和部署,然后面试官问我vllm部署为什么会快,我就讲了一下分页注意力,正好刚看过;然后问我模型量化了吗,我说量化了用的eetq,但是原理不太清楚 3.拷打第一个项目,我的是一个rag的,先总体讲了一下,然后问我项目跟常规的比有什么亮点,我讲了一下对比解码,然后说多路召回,面试官说这
第一轮面试 2024-07-26 约的10:00,很准时就开始了,然后一共6分钟(我感觉受到了侮辱) 问题内容: 自我介绍 是否了解浪潮通信信息 是否对研发感兴趣 在项目或实习中担任角色 项目是领导设计好你负责实现,还是说你也参与功能设计 会不会Java 会不会软件开发 Python2和Python3的区别 反问:业务内容 答:不同部门不一样 反问:面试流程 答:如果通过了的话,分到部门后会有二次