据说是965的神仙公司,面试官有帅哥、有既好看声音又好听的小姐姐,都保养的很好,基本上都没有大厂的岁月感,慕了慕了 一面 拷打论文、项目 问输入输出、评价指标、改进和不足 把你的研究经历串起来 问模型训练、RAG、embedding、transformer等基础八股 二面 拷打项目、论文 数据质量评估 数据多样性、去重、配比的衡量 智能体 attention、kv cache等八股 手撕softm
整体不到1h前20min讲了一个项目,没太详细问。 然后八股: 1. Llama2架构 (embedding, transformer block, LM head) 2. Llama2 transformer block里做了哪些改变 (RMSNorm, RoPE, SwiGLU, PreNorm不太清楚说全了没) 3. 为什么用RMSNorm不用LayerNorm (答参数量少,不太对) 4.
技术二面,两个面试官 一个看起来年轻一点,一个看起来更大一点,估计是大老板上。 面下来感觉半挂半过,也是偏向于技术+行为面,更多会看个人潜力,这也是我尴尬的地方。 1.自我介绍 年轻面试官先问 1. 介绍一下你这个项目 2. 有没有涉及到模型训练(有,讲了一下) 3.你这个 prompt 是怎么调的?格式结构化有没有遇到问题? 4.一般你怎么去评估你的这个模型? 后面就开始尴尬了 5.除了大模型,
hr(20min)+技术面(30min) 技术: 1、transformer的解码器的优化策略? 2、位置编码的方法? 3、transformer用的归一化方法?BN、LN、IN、GN的适用场景和缺点? 4、CNN处理文本和图像时的区别? 手撕: 背包问题: 给定背包最大能装的重量,物品的价值和重量,如何装物品使得背包的价值最大。(不使用排序?) #京东##京东nlp##京东一面#
一面 拷打论文、项目 拷打预训练、SFT基础 gpt类型的八股 llama更新迭代、MoE 手撕最长无重复子串 鉴于某小地瓜平台喜欢copy我的面经,我就不具体列出问题了,有需要具体细节的可以私聊我 二面 拷打论文 decoding 对齐算法 配比、数据质量 场景题 手撕 “leetcode刷的多吗” “不多” “那写个快排吧” 三面 拷打项目 预训练流程 RL知识 数据质量保证 拷打论文 问业务
整体不到二十分钟,电话面 1.自我介绍 2.让我讲一下网易实习做了什么,我大概讲了一下;问我实习用的模型参数量多大,我说了一下;让我讲一下vllm框架原理,吟唱了一下 3.问我了不了解强化学习,我说项目里用过,就结合项目讲了一下 4.让我挑一篇论文讲一讲创新点,我就开始讲我最近的一篇,一套连招吟唱了一遍 5.问我接没接触过知识图谱,我之前做项目用过,大概讲了一下实体关系、neo4j啥的 6.反问,
1.介绍项目 2.八股 用过什么机器学习算法? 讲一下随机森林 xgboost bagging boosting 讲一下逻辑回归 用的什么loss 模型过拟合怎么解决? 测试样本不均衡选用什么评价指标? 都是些机器学习的问题 3.两道算法题 比较开放#面试经验##算法面试经验分享#
全程一个小时 1.自我介绍 2.挑一个项目介绍,我介绍了我论文的项目,直接共享屏幕,分块介绍,中间穿插着很多提问,面试官貌似对共情的相关介绍有很多疑问 3.面试官看我之前有一篇论文也跟这个相关,又让我讲一下那篇论文,我就又共享开始讲,到此为止还是比较顺利的 4.反问,问部门的业务,说是做文档问答、RAG这块的 5.代码题,此时开始凉了,面试官说我笔试做的不好,要给我出一道算法题做一做,然后给我发了
好未来-base北京-nlp lora的矩阵怎么初始化?为什么要初始化为全0? gpt源码past_key_value是干啥的 gpt onebyone 每一层怎么输入输出 输出的分布如果比较稀疏,有个尖尖应该怎么处理 讲讲决策树,决策树回归问题怎么做 gpt的输出topp是啥 kl散度的公式和kl散度与交叉熵的区别 强化学习的输入 chatgpt的reward model怎么来的,三阶段 car
1. 目前实习工作, 为什要用聚类来评估文本向量化表示? 2. DBSCAN算法原理(简历有) 3. 生成模型的的Category不存在预定义集合怎么办 4. UIE+Category具体流程 (实习) 5. 分类评估用的是什么指标 6. bert模型中文本到id转化的过程是怎么样? 7. 现有流行的模型相对于transformer,多头注意力有哪些改进/不同 8. 现有流行的模型相对于trans
分享面经 攒攒欧气! 一面 1. 首先是自我介绍加一个项目介绍 介绍了研究生期间的课题 用了什么方法?提升了多少指标?分析过badcase吗? 2. 简历有写大模型微调 问了目前的大模型微调方法你觉得哪一个最好? 3. 反问 二面 1. 自我介绍 2. 介绍命名实体识别项目,实体嵌套怎么解决? 3. 介绍大模型角色扮演项目,数据集怎么构建?原本微调后大模型只能扮演一个角色,问训练一次能否实现大模型
一面(7.4,数据处理部门) 自我介绍 手撕代码一: [[1,2,3], [4,5,6], [7,8,9]]进行螺旋输出[5,6,3,2,1,4,7,8,9] 手撕代码二: 括号匹配,给定字符串'231(Jjhg){ds}'检验括号是否匹配 介绍一下台风估计项目你遇到的数据预处理 介绍一下LSTM LSTM各个门用了什么激活函数,以及这些激活函数的作用 讲一下你的爬虫项目,怎么
自我介绍(大概5分钟) 聊我中的一篇ACL论文,介绍了下任务、出发点、具体的做法以及评价指标 聊我在实习过程中做的一些项目(比较细,包括应用场景以及项目细节)。 阐述ChatGPT的构造、llama、chatglm大模型的区别有哪些(衍生出来很多具体细节)、介绍Roberta和BERT区别 手撕代码:leetcode33题:搜索旋转排序树组,要求复杂度O(logn)。(没刷到过这个题,所以用了一个
一面通过 总体:AI研究院、30min、面试很快、没有手撕算法。 内容: 1论文细节,模型结构、损失函数、优化目标,baseline怎么选择的,超参数怎么选择的。 2最近实习的内容,大模型相关。几种LM的区别,在预训练阶段有什么不同。****怎么解决? 3为什么有一段实习时间比较短? 4最近看的论文是什么
开个贴记录一下秋招,顺便分享一下科大讯飞NLP算法岗凉经。  6.30 一面, 7.5 收到邮件没通过面试前视频,语音都通过了检测,但不知道为什么面试官听不到也看到我的视频,我也听不到面试官说话。最后还是开的微信视频面试的😂 面试问题: 自我介绍 怎么学的Python Python list 的底层实现(没研究过,只会使用) Java ArrayList, LinkedList 的区别 B+