20分钟左右。三个面试官。 数据增强,boosting,bagging和stacking区别,超参数调优什么的,基本都是项目相关的机器学习的内容。hr问期望地点,对部门的了解,还具体问了我本科时候发的论文,说是闲聊。希望能过 #建信金科#
之前投了百川的大模型算法工程师(行业大模型)。 一面只让我自己介绍了简历,然后就是反问环节。总共二十分钟无代码 二面线下面,纯聊天无技术。就问我感觉最无聊的跟最有意思的事情。我说我感觉找数据没意思,训模型有意思。结果面试官说他觉得恰恰相反,我就赶紧顺着他的话说,他又说你不用顺着我说,我就想听你反驳我。(直接就被看穿了😅😅。感觉不愧是懂大模型的,凡是涉及到技术的点我还没讲就说这个我懂你不用说。哈
一面是一个技术小哥,交流起来没有压力 (甚至比我导师更理解我在做什么事情) 分为三个部分 1、简历,主要是论文 2、写了一个算法题,nms 3、聊了一下他当前做的一些方向,因为我在这个方向了解不是很多,所以小哥也非常体谅我,让我自由发挥即可,我答的可能不太合理,小哥表示没有问题 总体来说,面试氛围很nice,面试官有耐心,没有因为晚上8点面试表现出不耐烦,更像是学术上进行交流(小哥的水平应该比我高
问项目经历,深入探讨细节 问深度学习基础知识 过拟合/欠拟合以及解决方式 vit和cnn的区别 感觉问答还听流畅的 算法题: 1、字典分词 字符串匹配 做出来了,但是O(mn),字符串匹配过程有些冗余 2、旋转有序数组找最小值 56781234是有序数组旋转4次后(旋转:把第一个元素放到数组末尾) 卡住了,没找到合适的规律,面试一结束就想出来了 字节要做的算法题好多 最后说他们是做nlp的,也不知
昨天一面完,今天上午就说二面了。 1.自我介绍 2.实习经历,问得究极细,做了什么项目,用了什么技术,数据哪里来的等。问完这个我都颤抖了。 3.只问了一个项目,也是一样的,问得特别细,也是lora原理,还有项目的参数是多少,训练了多久,数据哪里来的,是什么样的。 最后一个问我大模型的损失,给了概率,问损失是多少。 整整拷打了一个多小时,现在头都是懵的,不说了,赶紧睡一觉恢复元气。
我投的是算法,面的我go,6月17号晚上6点打电话说18号下午2点半一面,重点考察go。最搞笑的是第一次用飞书视频面,在会议室外面待了7分钟,没看到加入会议4个字,直接迟到。 1.go内存逃逸 2.make和new的区别 3. 协程调度/gmp模型工作过程 4. 贪心算法思想 5.gpt底层,有什么优点缺点 6.反问 基本上没答上来啥,面试官全程眉头紧锁,估计是没见过这么差的,说有写代码环节,直接
8.19 自我介绍 问最近的一个实习项目,是做口腔大模型的:(侧重于模型训练) 1.数据集规模、筛选和配比 2.超参数有哪些。学习率的选择,怎么寻找超参。小规模数据,怎么跑的,是串行还是并行。loss曲线怎么看的 3.DeepSpeed介绍,用的什么配置(zero_2) 4.为什么选择 Qwen1.5-32B-chat (就俩卡,用57B跑的太慢) 5.BLEU-4的计算公式 5.模型评估是怎么做
淘天面试官给我出了一道接雨水,我微微一笑,虽然很快写出来了,但是也明白给我出困难题是什么意思 记录一下,先问了数模的项目,建模过程,问题拆解思路。然后问了两个算法项目,就vilt模型细问了些,还问我知不知道多模态算法的发展。 然后问了下另一个项目,脑电分类的,感觉不太感兴趣。 考了transformer八股。最后出了一道接雨水,很快做出来了,感觉面试官也不想面了,说你做的太快了,题我们下来再看,最
一个小时左右 计算与智能平台部 做智能客服,美团app上在接入人工客服前的自动回复都是他们做的,主要用得到技术是RAG。有用开源模型continue learning,也有用美团内部的模型。团队比较关注外部最新进展,比如昨天的Llama3,会拿来跑榜单。 给了一个场景,让我想想会怎么做: 给你一个大模型,怎么去做情感分析?比如客服场景,判断用户的评论是抱怨还是投诉还是夸奖。 特定领域微调大模型后通
1.问项目 2.八股 cross-attention的用法 图生文 图生图 图生视频的一些模型 3.无算法题 可能是项目讲的比较久就没怎么问八股#面试经验##算法面试经验分享#
女面试官态度蛮好的,起码比上一场百度的好10倍 面试官先介绍组里的工作,自研大模型做客服 自我介绍 项目问答 八股问的比较少 位置编码 llama设计上跟原始transformer的区别 算法题:买卖股票问题2 给了一个网店智能客服的场景,比如客户问衣服尺寸之类的问题,训练数据如何设计。 问对什么方向感兴趣? 了解RAG吗?RAG起到了什么作用,大致流程是怎样的?
阿里大文娱优酷,没做笔试直接约面试。 1.自我介绍 2.实习经历 训练数据有哪些组成部分? 每一个样本是只有一句话参与训练还是都参与? 用的什么训练框架? SFT 的过程中有没有遇到什么困难? 你们这个流程中,有需要人力评估吗?在哪一部分? 多机多卡训练的时候用到了 deepspeed 吧?你了解 deepspeed 吗? 流水线并行了解吗? 你们训练的时候学习率怎么调的,用不用 warm up?
1.问项目 2.八股 GPT和bert的区别 GPT做文本理解的效果会比bert差吗? 扩散模型 文生图 图生图 图生图有几种不同的方式? CLIP是怎么训练的? CLIP的损失#面试经验##算法面试经验分享#
现在我想在一个集群中用spark-submit(集群模式)运行我的应用程序。我的项目的所有依赖项的jar文件都存储在HDFS上。只要我的配置文件包含在jar文件中,一切都可以正常工作。但这对于测试目的来说是不实际的,因为我总是要重新构建JAR。 因此,我排除了项目的配置文件,并通过“driver-class-path”添加了它们。这在客户端模式下工作,但如果我现在将配置文件移动到HDFS并在集群模
我们正在使用spring boot starter data redis(1.5.9.RELEASE)以集群模式连接到AWS弹性缓存(redis)。 如果我们不启用Redis Auth(密码)并在AWS弹性缓存中加密传输中的数据,一切都很好。 当数据传输和启用redis auth时,我们得到连接重置异常。 以下例外情况: 更多异常详情: