Bert的模型架构讲一下? BERT模型的全称是:BidirectionalEncoder Representations from Transformer,也就是说,Transformer是组成BERT的核心模块,而Attention机制又是Transformer中最关键的部分,因此,利用Attention机制构建Transformer模块,在此基础上,用多层Transformer组装BERT模
1.自我介绍 2.项目拷打 3.实习拷打 4.微调的显存需求,如何估算?经典的Deepspeed举例 5.deepspeed 原理 (ZeRO三阶段、offload) 5.多标签文本分类,怎么选大模型,loss怎么设计(不太会传统的NLP任务,每个文本可能有多个标签,只回答了一个交叉熵损失) 6.z字螺旋矩阵生成(感觉不能叫螺旋矩阵): 具体为给定一个正整数N,生成下面形式的NxN的矩阵 N=4为
在boss直聘找工作,最早最快来的是本家的面试23333 自我介绍 第一份工作的规划 讲项目,打开ppt讲了。中间问了一个为什么简单的检索在项目里就很有效(我这边的是有参考文献的结论回答的) 问:最近大模型的趋势,发展方向自己的理解 然后讲一个自己比较了解和喜欢的llm技术,我讲了rope 问:应对超长的输入,llm怎么处理,以及有什么难点 还有看过什么最新研究吗,这个我确实没看 问flash a
用的是赛码的面试系统,面试官到点发起了语音通话,在线IDE。 ------------------------------------------------------------------------------------ 自我介绍,五分钟结束,然后面试官没有就自我介绍提问。直接说开始做题,从这里感觉到这是KPI面了。 -----------------------------------
1.介绍项目 2.场景题 大模型微调的全过程 大模型的多轮对话数据集怎么构建 怎么训练 对话上下文太长了怎么办 RAG技术 怎么存储的 3.算法题 两数之和 mysql的查询题#面试经验##算法面试经验分享#
1.问了一下学校 哪里人 2.问了一下有没有做过数据挖掘 机器学习的项目/竞赛 3.问项目 4.有没有其他offer 想做什么方向#面试经验##算法面试经验分享#
1.介绍项目 2.八股 用过什么机器学习算法? 讲一下随机森林 xgboost bagging boosting 讲一下逻辑回归 用的什么loss 模型过拟合怎么解决? 测试样本不均衡选用什么评价指标? 都是些机器学习的问题 3.两道算法题 比较开放#面试经验##算法面试经验分享#
最开始是在7.14投的豆包大模型,当时hr打电话喊我面实习岗,我一脸懵,后面才知道是转岗投递了。因为没有实习打算,相当于直接挂了这个志愿。 一直到8月10多号,被另一个好心hr捞起来面二志愿,最开始是走筋斗云计划。 时间线:8.20一面,8.21二面,8.27通知挂了选择转正式批,9.2三面,9.3通知挂了。效率很高!主要还是业务匹配度不高,早挂早好,希望其他同学顺利! 一面 1.自我介绍 2.论
5.15官网投递-5.19初筛通过-5.27上午面试。 面试全程半小时,介绍项目内容,问项目输入输出,项目数据量。然后做题,最长无重复字符串子串。做完反问。 面试结束后秒挂😅😅😅😅,我真的栓Q#暑期实习##OPPO##腾讯##阿里巴巴##字节跳动#
[toc] 简历投递 2022.05.27 投递时间:2022.05.27 行测 2022.05.30 三一集团最开始是发一个测评,分为4部分: 类似于阅读理解,文字类的 也是阅读理解,数字类,什么同比增长多少多少,第几季度多少多少 逻辑题,找规律选择 行测,选择最符合自己和最不符合自己的 行测,性格测试 笔试 2022.06.01 简历通过的话,笔试通知很快,我记得我是2022.05.30做的行
开头自我介绍 自我介绍完了,就详细介绍自己的项目 一个项目完了,就会进行提问 你说到的,都会问,所以尽量不要介绍自己不会的,用来装饰的,提b格的那种,被问住了很尴尬 问项目中遇到的难点,怎么解决,描述遇到的困难,确实是个挺难的问题,反正我是不怎么会说 没有手撕 最后反问 然后他问意向工作城市,期望年薪 #面经##面经一面面经##经纬恒润#
1. pytorch2onnx具体做了什么 2. 项目模型结构是什么样的 3. 为什么模型需要量化 4. 量化的过程做了什么,有什么样的效果 5. 量化的过程中为什么会有精度损失,损失是怎么调优的 6. LSTM怎么解决梯度爆炸和梯度消失的问题 7. 给101个硬币,其中一个是假币,称重两次判断假币比真币重还是轻 手撕(web IDE) 旋转矩阵 lc原题 方向不太match,面后秒挂 #字节##
背景:211本硕,一作SCI一区论文两篇,无实习。 一面(9.21) 1. 自我介绍; 2. 让我挑一篇论文说一下,在我5分钟简要介绍完后,开始深挖细节,基本把这篇论文挖了个底朝天,整个过程持续了40分钟左右; 3. 特征选择的常用方法; 4. 过拟合的解决办法; 5. 闲聊时间,问我为啥不读博; 6. 反问。 总结:面试官人挺温柔的,问题都集中在我熟知的领域,面试体验极佳。 二面(9.29) 1
从实习简历里被捞出来直接参加秋招面试的,流程开始的时候官网还没有放出来2025秋招岗位 7.16 一面 简单的根据简历聊项目经历,说我项目中做的内容和他们的工作比较匹配,一面时间比较短也比较简单。 一面结束后当晚通知通过,同时告知二面需要准备PPT介绍自己的项目,并约二面时间。 7.19 二面 项目介绍:采用腾讯会议共享屏幕的形式,介绍自己的一个项目(10-15分钟)。 提问环节:主要针对项目PP
[toc] 乐鑫科技 AI算法工程师 投递 2022.07.10 简历投递时间:2022.07.10 笔试 2022.07.12 时间:90 min 题型: 20个单选 2个编程 一面通知 2022.07.19 HR电话通知,约的 2022.07.22(周五)下午2点,牛客面试 一面 2022.07.22 面试时长: 40min 主要分成3个模块: 项目,同时在问项目的过程中,也问了一些基础深度学