本项目对 spark ml 包中各种算法的原理加以介绍并且对算法的代码实现进行详细分析,旨在加深自己对机器学习算法的理解,熟悉这些算法的分布式实现方式。
一共50分钟左右,基本没八股 1.自我介绍 2.挑一个项目详细介绍一下,我介绍了一下我的RAG的项目,吟唱完面试官说提问几个重要的点,第一个问了一下数据集怎么构建的,第二个问了一下大模型怎么解决幻觉问题,第三个问我数据集构建问答切分怎么考虑语义问题 3.让我详细介绍另一个项目,我另一个项目是论文项目,吟唱完面试官又提问几个重要的点,第一个问我论文里情绪划分详细怎么做的,第二个问我共情怎么定义的,都
一面 问实习 问的比较详细 然后问基础 XGBOOST算法详细介绍 XGBOOST算法与LightGBM区别 怎么筛选数据特征以及PCA怎么做 欠拟合怎么解决 注意不是过拟合 还问了一个业务问题 因为可能是美团平台事业部 写代码 leetcode 322 零钱兑换 要求同时输出零钱数量 以及 零钱组合 动态规划 粗心了 最开始只写了零钱数量 SQL 代码 比较简单 两个情形 一个题目 面试官水平挺
🕒 岗位/面试时间 12.21 下午三点半到四点半 👥 面试题目 自我介绍 ︎●八股文:BN 层原理 输出维度 计算步骤/ BN 和 LN 的区别/L1 正则和 L2 正则/过拟合怎么解决/梯度消失的原因和解决 ︎●项目:样本不平衡怎么解决/Focal Loss 是怎么计算的/增量学习的过程/知识蒸馏是怎么更新的/😇BN 层的缺点/为什么视觉不怎么用 LN?(我猜测是因为图像通道数目的原因,
时间:晚上10:16左右,20分钟左右 面试官男,非常疲惫,每次我回答完问题都沉默了很久,声音也很疲惫。 1、问学校,学位证,毕业证 2、项目经理(sd、lora、fine-tune过程) 3、L2正则化解释一下 4、用过BN(batch normalization)吗? (答了梯度消失的时候的最佳解决方案,顺便扯了梯度消失的时候换激活函数,实际上还有梯度爆炸也可以用) 5、用过Dropout吗?
全程45分钟左右,目测面试官是个主管 1.自我介绍 2.介绍实习经历,首先让我介绍一下整体业务,然后拷打数据构建部分,然后让我介绍一下vllm,然后让我说一下大模型幻觉问题怎么解决,然后让我介绍一下大模型跟bert那种相比结构有什么改进 3.第二第三个项目都是我介绍了一下,就没有了 4.代码题,写二叉树的前序遍历,用递归和非递归实现 5.问一些其他的问题,问我在小米和网易实习哪个好,让我说出两个网
整体70分钟,人麻了 1.自我介绍 2.介绍实习内容,我介绍了一下我在网易做智能npc相关的,他说他之前也在网易伏羲工作然后他开始问我业务背景,问我训模型调了什么参数、测评怎么做的、数据怎么优化的,问得很细 3.介绍第一个项目,我的是一个rag的项目,我先整体介绍了一下,他开始问问题,问我数据构建,向量库构建,用的什么数据库存储的,召回怎么做的,然后问我对比解码的原理,问我对rag做优化的话有什么
用的是赛码的面试系统,面试官到点发起了语音通话,在线IDE。 ------------------------------------------------------------------------------------ 自我介绍,五分钟结束,然后面试官没有就自我介绍提问。直接说开始做题,从这里感觉到这是KPI面了。 -----------------------------------
全程35分钟,是个女面试官,感觉气场上应该是个部门主管;无手撕算法 1.先介绍了部门情况,第一次见面试官先自我介绍的,感觉确实是个领导,有亲和力 2.自我介绍 3.拷打第一个项目,我本来想共享屏幕对着模型图讲,结果面试官说不用,我就直接讲;这个面试官理解能力很强,我讲的她基本直接就懂了,之前有的面试官要问我好几遍;然后提了一些问题 4.拷打第二个项目,主要介绍了项目整体以及一些亮点,然后问了我幻觉
面试形式 3轮面试+1轮hr面。 时间线: 一面X 二面X+14 三面X+14+7 hr面X+14+7+7 其中,对时间信息进行脱敏,一面开始时间作为基准,记作X。例如,X+1表示距离一面的时间为一天。其中,对精确的时间也进行了相应的模糊处理,1-7天,就记作7天,可以认为是在一周内,8-14天,记作14天,可以认为在两周内。 一面(1h,X) 自我介绍 项目讲解与介绍,讲的自己上传的PPT(30
我目前正在做一个报告,我想找出两个日期之间的月份。我目前有这个 =(DATEDIF(U224, V224,"m")1) 然而,我希望它添加另一个元素,如果初始日期是在本月15日或之前,如果是16日,则会四舍五入,之后会四舍六入。 例如,第一个日期是2月13日,第二个日期是6月31日。它将带回5个月。然而,如果第一次约会是2月20日,则会提前4个月。 提前谢谢
本文向大家介绍Python科学计算之NumPy入门教程,包括了Python科学计算之NumPy入门教程的使用技巧和注意事项,需要的朋友参考一下 前言 NumPy是Python用于处理大型矩阵的一个速度极快的数学库。它允许你在Python中做向量和矩阵的运算,而且很多底层的函数都是用C写的,你将获得在普通Python中无法达到的运行速度。这是由于矩阵中每个元素的数据类型都是一样的,这也就减少了运算过
问题内容: 考虑以下代码: 为什么会出现这些错误? 问题答案: 二进制浮点数学就是这样。在大多数编程语言中,它基于IEEE754标准。问题的症结在于数字以这种格式表示为整数乘以2的幂。分母不是2的幂的有理数(例如,是)无法精确表示。 对于标准格式,表示形式可以完全按照 以十进制表示,或 以C99十六进制表示法表示。 相比之下,合理数量0.1,这是1/10可以完全按照书面 以十进制表示,或 以C99
问题内容: 我有一个在。其中包含一个交货单。 因此,可以重复相同的日期(在一天中,我们会下达几笔订单),如下所示: 我要计算的每篇文章的营业额的AVG ,我将进一步说明: 我已经在下面的请求中提取了月份,但是我无法动态计算(因为我的数据应该每月更改)上面的示例所示的营业额: 我尝试使用,但无法获得最佳解决方案。 我提出了一个要求,以计算以下内容(我手动完成)中每位客户的营业额: 她的结果如下: 我
看问的人多,呢就发个文,我一般不归纳记问题,所以可能不是那么全,按印象写一下。 笔试:挺简单,三道编程一道gcd模板,一道合并两个升序数组,还有一道忘了,反正都是leetcode简单难度应该。 一面问的多,我回答的很全所以答了一个小时左右: 数据库有哪些范式 java的垃圾回收机制 java的gc函数 java反射机制 java hashmap jdbc中statement和prepa