岗位:机器学习/数据挖掘/自然语言处理工程师 面试体验:第一个面的公司,很紧张,也是被拷打的最狠的一次 一面 8/23 70分钟 1. 自我介绍 2. 实习拷打 推荐算法中的相关模型和前沿理论 是否有读过最近的期刊上的文章,做一些介绍 3. 科研拷打 如何做的模型 其中的系数如何确定 4. NLP拷打 Attention介绍 QKV是什么,举例说一下 Tranformer的encoder和deco
百度2024秋招机器学习一面面经 岗位:机器学习/数据挖掘/NLP-T联合 部门:百度地图 地点:北京 一面 自我介绍 对项目和实习的大概询问,没有去深挖,只是对一些问题进行询问 询问对大模型的了解,讲了 RLHF 的原理 RLHF是一种新的训练范式,通过使用强化学习方式根据人类反馈来优化语言模型。一共包括三个步骤: 预训练一个语言模型(LM) 收集数据并训练奖励模型 (Reward Model,
11月27日 首先自我介绍,大致说了一下自己硕士阶段的项目工作。项目用的是高德地图数据😂,面试官好像并不在意这个。 从项目中提的问题: 1数据处理工作包含的内容 2交通异常检测任务细节 3超图的概念,为什么要用超图 4论文中自己算法的指标有多高(自己记不清了,翻了一下手机,被笑话,说这样会让人怀疑不是自己做的) 5Lstm原理,优缺点(我不太清楚优缺点,但是回答了比RNN的优势) 开放性问题:
自我介绍到一半打断了,直接问八股…… 关注的点和一面一样有点奇怪,特别喜欢问我记不记得base模型的d_models和seq_len以及各种各样的参数…… 项目里一直纠结我训的1.5B模型,我跟她说我还训了3.8B和72B版本,没让我讲下去,说1.5B已经很大,可以满足我们项目需求了…… 代码题做了lc. 236的变体最近公共子节点,和lc. 15三数之和,手撕的没什么问题,但这三数之和在一面已经
#非技术2023笔面经#3道问答题70min限时,剩下的是行测,总共2h 1. 如何评估会员业务收入是否还有提升空间?若确定有提升空间,如何提升收入? 2. 以百度的一款产品为例,如果要向Web 3.0转型,应该从具体哪些方向入手? 区块链技术、代币经济、去中心化存储、数据控制和管控 3. 图像识别技术很火爆,比如搜图,还有手机厂商的智能识图功能,你觉得可以从哪些方向继续提升图像识别产品? 价值、
机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。
主要内容:机器学习,深度学习,机器学习与深度学习的区别,机器学习和深度学习的应用人工智能是近几年来最流行的趋势之一。机器学习和深度学习构成了人工智能。下面显示的维恩图解释了机器学习和深度学习的关系 - 机器学习 机器学习是让计算机按照设计和编程的算法行事的科学艺术。许多研究人员认为机器学习是实现人类AI的最佳方式。机器学习包括以下类型的模式 - 监督学习模式 无监督学习模式 深度学习 深度学习是机器学习的一个子领域,其中有关算法的灵感来自大脑的结构和功能,称为人工神经网络。
主要内容:数据量,硬件依赖,特色工程在本章中,我们将讨论机器和深度学习概念之间的主要区别。 数据量 机器学习使用不同数量的数据,主要用于少量数据。另一方面,如果数据量迅速增加,深度学习可以有效地工作。下图描绘了机器学习和深度学习在数据量方面的工作 - 硬件依赖 与传统的机器学习算法相反,深度学习算法设计为在很大程度上依赖于高端机器。深度学习算法执行大量矩阵乘法运算,这需要巨大的硬件支持。 特色工程 特征工程是将领域知识放入指定特征的
前段时间投算法实习一直没回应,当时觉得连简历都过不了很焦虑,还发了一条动态挺多人回我的。后来陆陆续续也有企业找我笔试,目前做的两个都过了。周中收到了百度的面试通知。 人生中第一次求职面试,不出意外地凉了。细问了项目,有一个强化学习相关的项目面试官相关知识应该挺熟悉,但是我主要做的是数据分析方面的工作,所以对核心算法的实现回答得牛头不对马嘴另一个项目浅问了一下。 然后就手搓代码了。一道搓出来了另一道
地图出行服务业务部-T联合 (一面已凉 投递时间:7.11(第一次投递的挂掉了) 变更岗位:7.26 测评邮件:7.26 面试时间:7.30 15:00,挂得很快,吃完饭回来就挂了 总时长:80min,其中项目40min 1、之前在百度做的岗位信息爬取和我的论文有什么关系,为什么离职了? 2、论文里的损失解释一下,设计的模型是微调的 or 预训练的? 3、比赛是自己做的还是组里合作的 4、tran
7.30一面 1.自我介绍 2.纯问项目,主要就是让讲项目,做这个项目的背景,以及具体思路。 3.手撕,(给一个有问题的路径,返回正确路径)
第一题: 没有用map,直接把字符串sort以后比较是否相等 第二题: 题目看了半天才看懂,解法用的滑动窗口 第三题(65%测试点) 一开始想先看看能骗多少分,不断拼接 red 循环直到 x,但是长度会超过限制的 1e5,好像过了65%。然后想太复杂了,越做分数越低,结束后写了一版不知道能对多少。 65%版本: 复盘版本: 思路:一个单字符循环的字符串,含有 n(n-1)/2+n 个回文子串,于是
9.13百度产品笔试题 #秋招# 一.第一部分(70分钟) 1.智能汽车如火如荼,百度网盘在智能汽车上有哪些机会? 2.某内容消费型产品,希望通过更精准的内容推荐策略,来促进用户体验,如果你来负责这个项目,你会怎么做? 3.你的客户提出一个需求,这个需求的实现需要协调多个团队,甚至跨体系的同学的支持,请问你如何得到大家的帮助? 二. 第二部分:行测题(10题×5部分) 个人觉得行侧题时间够基本都能
1. 通关 AC 题目大概意思:两个数组和一个t, 选择和不超过t的最大个数 思路:构建两者前缀和,遍历小的一个,对于另一个数组二分查找位置,记录maxn 2. AC // 给数组排m次序 // 输入一 n 个数组成的数组,进行了m次操作 // 每次操作由 a b 两个数定义 // a==1 表示把数组的前 b 个数从小到大排序 // a==2 表示把数组的前 b 个数从大到小排序。 // 输出m
2024届百度暑期实习c++机器学习算法岗笔试 30道选择题,感觉考得很基础,很多我没见过的概念...有几道考语音识别的概念,两道考kmp(问空间复杂度,问匹配到不同字符下一步怎么做),有森林转二叉树的题,有找出无向图邻接矩阵,还有考boosting和stacking,有几道代码填空(主要考c++面向对象相关的知识点),还有矩阵压缩的题。 两道代码题,第一题比较简单,求二进制串和有连续1的串异或得