荣耀:录用决策中 概况:投递的是大数据开发岗,整体面试流程较快,面试官考虑我本科商科背景也没有特别为难,更多是考察我对于一些大数据技术的基础认知。 一面: 1. 主要会什么语言?用过什么库?讲下自己使用机器学习算法做的一个项目? 2. 讲讲Hadoop的构成?遇到过数据倾斜问题没有?产生原因,以及解决方案?
背景:本硕中上985,本科数学专业,硕士计算机,投递岗位总行数据开发岗位,有两段算法实习,自己跟着CMU做过一个数据库项目,目前还在做一个TInyKV,代码能力一般。 9.30 笔试 笔试内容包括 - 行测 - 基础知识: 1. 大数据开发相关,spark,hive,hadoop等内容,因为没有做过相关工作,基本靠猜 2. 计算机
lz投递的是数据开发工程师方向 1. 笔试共两个半小时,分为两个部分 2. 第一部分是行测,共60道题目,具体题型分布不太记得了,限时60min 3. 第二部分是专业笔试,限时90min (1)单选 23题 (2)多选5题 (3)判断7题 单选、多选、判断主要考察数据库、Hadoop相关知识 (4)编程填空题18题 都是SQL题,难度适中#上海银行#
关于数分的面经好像很少,发一下积攒一下人品,面完的友友可以互通一下有无呀,许愿能有二面~ 时间点:9.21投递,9.29收到笔试,9.30笔试,晚上收到约10.5面试的邮件(上银前面好像比较快,会在一个星期左右发笔试,要是还没收到估计是凉了) 楼主是搞深度学习的,对数分可能不太熟悉,面前一直准备复习SQL,之前一直找的算法岗,一直没怎么问过数据结构,所以回答的不是很好,害 腾讯会议的形式,一共五个
一面 30min 自我介绍 项目经历 实习项目介绍一下 具体任务调度用的什么 ETL任务血缘怎么设置 实习公司数仓主题怎么划分 你所在部门构成 多少人 阿里云框架各部分负责什么功能 大数据国赛各部分做什么任务 Map Reduce过程介绍一下 count distinct的Map Reduce过程说一下 有几个map和reduce 实现count distinct功能你会怎么考虑优化 一道SQL
2022.10.9 一面 共15分钟 1.自我介绍:大概两分钟 2.问答: a.实习经历-sql是如何优化的 答得不好,明明是准备好了的, 一是优化整体逻辑,二是语句优化,只答了第一点,一定要清楚面试官问问题的内在目的,不要回答那么表面。 b.实习经历-窗口函数,三个排序(row_number, rank, dense_rank)的区别,答得不好,明明也是知道的,就按准备好的说,不要现场发挥啊……
1. 自我介绍 2. 秋招投递进度/方向/职业规划 3. 讲数据分析项目 4. 项目中用到模型的优缺点 (不是原理,是特点!什么场景选什么模型 我:都跑一边看哪个准确率高 面试官:………) 5. 其他数据分析的项目 6. 随机森林节点重要性怎么算的(再次不会) 7. 讲一个算法 8. 想做什么(偏业务数据分析还是模型算法) 9. 喜欢什么课 10. 业务场景题 11. 秋招有什么offer 大概就
✨添可和博世面经来啦 2️⃣基本上添可一面面试官的提问都是环环相扣的,根据你的回答,进行下一个提问,实际上提的问题应该比我回忆出来的要多,会围绕简历、过往经历以及岗位需求三个方面展开 添可二面是与HR部门经理1v1视频面试 提问如下: 1.自我介绍 2.为什么从本科到研究生专业跨度这么大 3.职业规划 4.对这个岗位的理解 5.会用哪些软件来计算数据 6.会从哪几个方面去推广校园招聘 7.怎么计算
下面是我那少到可怜的面试遇到的一些问题,处于保密考虑,我做了一些姑且算是脱敏吧,思想跟原问题差不多。全是凉经。 1.如何测算某产品销量。 2.如何提升某产品销量。 3.某弹幕视频APP(某乎)上架短视频功能,对这个功能怎么看。 4.某弹幕视频APP(某乎)有什么要提升的地方。 5.测算某类产品(游戏)市场份额,如MMORPG。 6.测算相似产品(如pdd,京东)重合用户数量或者比例,多少用户只用p
2022.10.10 一面 1h TDL优化推动存在什么问题? 所有的下游修改代码由公共层实现是合理的吗?如果不合理有什么解决方法? 目前整个数仓多少任务?(母鸡 目前数仓分几层?你觉得目前分层中的平衡应该怎么做到或者有什么思考? SQL题:一个tb表,里面有姓名,课程分数,课程名称,目标:取最高课程分数的学生名字。我的答案用了join,然后提问:join的优化有哪些? Java题:反转字符串,用
#迅雷#数据分析师 #笔试 1.hivesql条件判定语句 2.房间里有产品经理和开发人员,2人离开,1人是产品经理。求房间里开发人员的概率 3.一个部门,五分之二为数据开发,五分之二为数据分析,都从事的有四分之一,求都不从事的人员概率 4.推送会员卡折扣给长期未使用用户,其目的是(营收,流失,用户找回,拉升新增) 5.mapreduce如何解决数据倾斜 count,join,大小表,grou
岗位:数据研发还是什么去了具体忘了 题型:30道选择题,3道编程题 选择题中规中矩吧 编程题: 1.查询一个列表,要用到数据库的知识,这个我还没学过,所以pass 2.给一个字母字符串,输出字符串里面字母出现2次以上的字母 状态:AC 3.给一个n维矩阵输出它的倒序,例如(1,2)(3,4),输出(4,3)(2,1) 状态:AC 总的来说编程题中规中矩吧,不算难。 国庆过后,还一个offer都没,
二面 1、为什么用seatunnel进行同步,不用dataX? 2、seatunnel底层引擎是spark,那为什么不直接用原生的spark进行同步呢? 3、项目有什么做的不够好的? ODPS相当于hive,多进程写入会产生表锁,没法利用spark的并发优势——1.统一管理ODPS表,每个分区写入一张表,读取的时候直接读取表,然后每天定时进行聚合。这个过程对于用户来说是无感的。2.分布式锁,阻塞的
10.11 蚂蚁一面(共 20min) 电话面,随便聊了聊,说我要做笔试才有进一步进展,但我没时间做这个笔试 自我介绍 对部门业务的了解 对数据仓库的了解 询问项目具体内容 说我聊的还行,催笔试,笔试后才有相应反馈,笔试安排在10.11晚,有事没空做,再看吧 反问 部门重点在数据仓库构建还是在数据处理 #蚂蚁金服##秋招##数据#
小米数据某平台研发的面试 八月底投的,9.20号笔试 10.8打电话约一面 刚刚面试完,整个过程让人感觉自己牛逼的不得了 自我介绍完后面试官说你这会java不,我说会一点,我之前用过cpp go python 可以学 然后面试官就开始劝我说我不适合他们部门,我应该去别的部门,我来这里屈才了 然后就说今天面试到这里吧,我看了一下时间还不过七分钟.…. 要真不合适你千嘛把我捞起来面试啊大兄弟 #面经#