1. 自我介绍 2.项目介绍 3. 你的项目有用到很多微调方式,能给我解释一下吗?(lora pv2 prompt tuning 等) 4. 能详细介绍一下 Transformer 结构吗? 5. bert 在训练的时候, 如果一个 batch size 的内容长度不一样, 这个怎么解决?(我说的加 padding token) 6. 那加 padding token 会不会对计算结果有影响? (
一面(八月四号) 面试官人很好,很温和,挺会引导的 问了论文和科研经历,并且给了一个假想的图文匹配的场景,问你有没有什么思路 没问八股 手撕题目是合并区间,没什么太大的难度 不知道一面的结果会咋样
聊聊项目经历,聊ai发展方向,视频理解的实际应用,聊为什么想去北京,聊北京户口,有没有女朋友啥的 我问他 落地还是技术中台 ai伦理问题的看法 和其他部门的协作方式 对应届生的期许 招聘流程 三面比较综合,开放性问题多
65b最近很累了,问了半天发现是校招的,不是社招的 面试时长:40min 面试内容: * 自我介绍 * 实习介绍 * raft协议 * redis一致性 * AI框架前端 * avl和b+和红黑树 * tcp粘包 * reduce优化 * copy on write * 零拷贝 * 堆查找元素 * 模板结构体 * 智能指针具体使用 * 完美转发和右值 * 协程调度 * sm、block、warp
1.自我介绍 2.实习经历,具体做什么?怎么做? 3.拷打项目 4.Lora是什么?怎么做的 5.指令微调是怎么做的?斯坦福羊驼数据是怎么来的?自己有用过这个技术吗? 6.两道手撕题(木桶效应,短板已寄) 我觉得回答得还行,但是手撕题没做出来,不说了刷题去了。
bg26届双9文跨,无论文无实习,项目是玩具 1.自我介绍 2.问项目 3.讲Zero原理,讲的比较细致 4.问transformers的具体实现,问根号k为什么要除,我说为了训练稳定性,问具体原因,是如何影响训练稳定性的,不知道。 5.问transformer参数量占比,FFN层占比例多少,不知道。 6.算法题是最长递增子序列,1分钟A了
快Star,没有笔试 没有八股,更多的是聊了聊实习经历 面试官感觉蛮aggressive的 说的是给30分钟做几道题,结果第一题反转链表就寄了(感觉快手很爱考这道题),太久没写,犯了个愚蠢的小错误,调了半天,最后只做出来这一道题 估计要挂了 最后问了问部门情况,感觉这个JD也蛮奇怪的,既有toC的大模型业务开发(这和其他后台开发有啥不一样的?),也有给算法爷的AI Infra。
#软件开发笔面经 1.自我介绍 2.拷打实习和科研,两段实习,没论文,实习的内容反反复复讲也就那点东西,没有太多值得深挖的点,面试官估计也不想深入问了。 3.手撕multi head cross attention,基本上写出来了,面试官也没让我详细讲思路,看了一眼就结束。 全程没问八股文,反问环节问了一下部门研究方向应该是偏传统CV方向的,跟大模型关系不大。 一面应该是没过,收到邮件推荐我转投其
一面 HR,这是二面,技术一面。 面试官人很好,聊了很久,总结一下问题吧。 1.自我介绍 2.项目介绍 3.你这个 prompt 是怎么调整的? 4.你如何评估你们这个效果呢?(我从数据评估和模型评估两方面讲) 5.你们的训练数据怎么构造的?用的什么格式? 6.全参微调训练一次多久? 7.主要是 SFT 吗?没考虑强化学习? 8.你觉得为什么现在大模型都是 only decoder?有什么好处?
上次看到人家内推就投了。。。只能说感觉和互联网面试体验不太一样 女面试官声音很温柔 全程拿着我做的 PPT 在介绍实习项目 中间好几个点感觉面试官都不太能跟上我啊😮💨 也没问啥太多问题 问了一些 query 改写 为什么用 jaccard 相似度不用语义相似度之类的 最后累死我了讲了 45 分钟,面试官说:你这讲的都是大模型项目介绍,那有没有什么内容能体现你的算法能力呢? 我:啊?你是指哪方
现在基本都是项目为主,美团面试官也比较好,不太刁难人。 1.自我介绍 2.项目介绍 针对项目提问 3. 我们如何评估模型训练数据的质量(从定量和不能定量两个角度) 4.RAG 长记忆检索的时候怎么提高召回率的? 5.记忆能解决你们 prompt 过长吗? 6. 模型质量怎么评估的? 7.讲一下最近看过什么论文? 代码题:编辑距离 几乎没有问八股,项目聊天 45 分钟,15 分钟代码。 问业务,是做
第一次分享,攒人品! 一面 🕒 岗位/面试时间 快star大模型应用/8月9日早上 👥 面试题目 1.自我介绍 2.题目 leetcode300 最长递增子序列 15min 没让讲思路 3.研究进展,投什么会议 4.实习经历 5.实习项目中数据是怎么做的 追问,数据收集过程中是否有人工处理 蒸馏效果不好的原因是什么,用了什么额外的方式 有没有做量化和加速 6.偏好数据集是什么,偏好怎么定义的
通信: 1、常用通信协议? 2、TCP/IP协议有哪些层?TCP/IP可以进行流量控制吗? 3、可靠通信需要注意什么? 操作系统 1、linux的进程调度? 算法: 1、n个节点的二叉树形态个数? #中兴##智算大模型#
一开始会以为问的很难,然后还是集中在项目,八股也比较常见,虽然问的还挺深,我没答出来很多。 1. 先写题,dp, 两个字符串最长子序列 2.自我介绍 3. 挖项目挖了很久 4.peft 微调介绍一下 5. 常见的位置编码介绍一下 6.transformer 的 decoder 和 llama 有啥区别 7. 他们的位置编码有啥区别? 三角函数位置编码和 ROPE 公式很像啊,他们是怎么实现不同的功
45分钟 潞晨科技是做colossal AI的那个公司 面试官base 新加坡 团队介绍: 主要做的是训练框架,包括STF、RLHF、长文本、数据处理、MOE、模型评估。 团队人很少,主要base新加坡和上海。 不是核心的colossal ai,那个有同学在,做分布式训练 面试官上来之后看了一遍简历,说跟他完全不是一个方向,所以主要是我在介绍我的工作。从实习开始介绍,中间有问题会打断。 介绍完之后