预训练数据收集流程 隐私过滤是怎么做的 怎么用OCR算法解决读取pdf公式语料以及双栏pdf的问题 预训练数据集构建中的亮点 数据质量评估方式 垂域评测集的构建方式 微调评测集是怎么做的,全参微调还是lora,lora原理 图文模型是怎么做的 没有八股,coding是旋转图像和编辑距离二选一。 全程都是问项目。团子面试体验太好了,面试官情绪价值拉满,就迟到一分钟但还是道歉,全程点头微笑,快比我还礼
bg和前两次面经可以看动态 9.21上午收到线下终面通知,约的9.23下午2点,面试地点在哈尔滨一栋写字楼内,迈瑞包下了其中一整层,不过里面看起来空间不大,也没有各种研发用的设备,应该只是迈瑞在哈尔滨的一个办事处 简单进行自我介绍,然后开始唠一些个人情况,感觉更多是像性格测试?面试官也直说了就是走流程,全程人也非常nice,语气很温和,时刻保持微笑,有问必答,体验很好 以下有些问题记得不全,差不多
8月底投,昨天给1面通知,今天10点约面 bg 双末9,做医学信号+ai这块 论文情况一篇中科院q2录用,一篇b类q1在投 一面30分钟,用ppt做了自我介绍,但因为是秋招第一次面试说得有些磕绊,感觉不太好 高强度拷打项目经历,各种细节问得非常多,反而没问半点论文,没有各种八股问题和手撕代码环节(不排除之后有) 最后问了些个人简单情况,base意向,有无女朋友之类的,还投了哪些企业,工作选择你比较
昨天上午一面面完,当天下午通知今天二面......效率奇高,bg和一面可以看之前的帖子 下午两点半开始,二面30分钟,吸取了一面准备不足的教训后重新调整了ppt,准备了演讲稿 开场先常规的自我介绍,ppt+演讲稿=自我介绍如鱼得水,建议没有准备的🐮友们速速准备下 然后围绕论文和项目开始问,论文问了一些实现细节和相比其他方法的优点,怎么想到的方法等等 项目相比一面基本没怎么问,简单问了下是
整体25分钟,综合面 1.自我介绍 2.问我获得十佳研究生是学校哪个部门评的、什么依据、我的优势是什么,还问了一些我国家奖学金之类的荣誉的评选细节,感觉这种所还是挺看成绩和荣誉的 3.问我比赛相关的,让我挑出来一个认为做的最好的比赛、然后问我在里面的角色、遇到的最大困难、如何统筹队伍、如何激励队员、如何分配奖励,这块还问的挺细的 4.问我为什么想来30所,我就说成都好、30所是比较好的选择等,问我
整体22分钟,这轮是hr面,她说通过的话还会有一轮主管面 1.自我介绍 2.问我实习相关的,问我实习有什么感觉,我说了一下网易这边的实习,然后和小米做了对比;问我期待的工作氛围是什么样的,我说了一下;问我实习做项目和在学校做项目有什么不一样,我就说了一下 3.问我对汇川有什么了解,我说了之前在官网看的,然后又搬出汇川杯大赛,夸了汇川一波 4.问我的职业规划,我就说了一下不想去互联网,想去和实体产品
全程45分钟左右,目测面试官是个主管 1.自我介绍 2.介绍实习经历,首先让我介绍一下整体业务,然后拷打数据构建部分,然后让我介绍一下vllm,然后让我说一下大模型幻觉问题怎么解决,然后让我介绍一下大模型跟bert那种相比结构有什么改进 3.第二第三个项目都是我介绍了一下,就没有了 4.代码题,写二叉树的前序遍历,用递归和非递归实现 5.问一些其他的问题,问我在小米和网易实习哪个好,让我说出两个网
整体70分钟,人麻了 1.自我介绍 2.介绍实习内容,我介绍了一下我在网易做智能npc相关的,他说他之前也在网易伏羲工作然后他开始问我业务背景,问我训模型调了什么参数、测评怎么做的、数据怎么优化的,问得很细 3.介绍第一个项目,我的是一个rag的项目,我先整体介绍了一下,他开始问问题,问我数据构建,向量库构建,用的什么数据库存储的,召回怎么做的,然后问我对比解码的原理,问我对rag做优化的话有什么
全程40分钟 1.自我介绍 2.让我讲一下实习经历,我做的智能npc,主要先讲了一下数据处理和探索,然后讲模型全参微调和部署,然后面试官问我vllm部署为什么会快,我就讲了一下分页注意力,正好刚看过;然后问我模型量化了吗,我说量化了用的eetq,但是原理不太清楚 3.拷打第一个项目,我的是一个rag的,先总体讲了一下,然后问我项目跟常规的比有什么亮点,我讲了一下对比解码,然后说多路召回,面试官说这
40分钟 1.VQGAN反向传播怎么做的 2.讲几个你知道的轻量级网络 3.swim transformer那个移动怎么移的 4.这样做有什么作用 5. 4个iou的区别 6.怎么resize成有利于扩散模型的输入 7.SD微调方法 8.dreambooth原理,支持完全的新概念的注入吗,对以往概念的保留是怎么处理的? 9.controlnet原理,零卷积作用 10.旋转位置编码 11.对多模态有
聊项目 大模型微调方法了解吗,比如lora 了解位置编码吗 ropeta之类的 了解一些大模型的attention吗,比如group-attention LSTM相对于XGB的改进 解释一下直方图算法,level-wise分裂方法 level-wise和leaf-wise的优缺点分别是什么 leaf-wise带来的过拟合问题怎么处理 为什么人们更常用GBDT而不是决策树 XGB相对于GBDT的改进
整体23分钟,一共两个面试官,一个是hr,一个是技术 1.自我介绍 2.hr开始问问题,让我介绍一下项目里遇到的难点、实习部门有多大、主要做什么、会转正吗 3.技术面试官开始问问题,先拷打我论文项目,说论文对数据方面的处理有哪些,我介绍了一下:然后问我论文里涉及情绪分类,有几种分类、怎么做分类的、如果加入新的类别怎么办、知道focal loss吗、多标签分类的话怎么做,然后问我项目里大模型微调大致
整体半个小时左右,相当于主管面,听说汇川三面挂人很猛 1.自我介绍 2.问我实习项目,先让我自我介绍了一下,然后问了包括用的模型架构、数据处理怎么处理的、模型推理加速用了什么策略、模型评估的策略等 3.问我第一个项目,先让我介绍了一下整体,然后问我模型数据怎么处理和向量化的、模型输入的提示怎么构造的、和检索到的块的关系是什么、模型对比解码细节讲一下等问题 4.问我论文项目,主要让我介绍一下论文的创
整体不到二十分钟,电话面 1.自我介绍 2.让我讲一下网易实习做了什么,我大概讲了一下;问我实习用的模型参数量多大,我说了一下;让我讲一下vllm框架原理,吟唱了一下 3.问我了不了解强化学习,我说项目里用过,就结合项目讲了一下 4.让我挑一篇论文讲一讲创新点,我就开始讲我最近的一篇,一套连招吟唱了一遍 5.问我接没接触过知识图谱,我之前做项目用过,大概讲了一下实体关系、neo4j啥的 6.反问,
1、自我介绍 2、深挖腾讯实习经历(聊了20min) 3、介绍第一段实习经历 4、指针和引用的区别 5、什么时候用malloc,什么时候用new(这里没答上来,感觉cpp里基本都用new了吧) 6、介绍智能指针(unique_ptr,shared_ptr,weak_ptr) 7、智能指针的底层如何实现的 8、如何排查内存泄露问题的 9、介绍c++的内存分布 10、静态链接和动态链接的区别 11、动