28min 一位很友好的大哥,感觉问的比较简单全程没有怼我,希望不是KPI面😓 一面 开问: 自我介绍? 介绍Spark 项目? 介绍数据仓库项目,怎么建模怎么分层的? 数仓分层的优点在哪里? 项目里面提到了留存率,你怎么计算留存率的? TCP说一说? TCP和UDP区别说一说? A 3条数据,B 4条数据 A left join B 结果会有几种情况? 双流join 讲一讲? 缓存过多你的解决
1-4面为春招实习,很遗憾最终没有通过,5-8面为秋招投递同一个部门,hr面后通知说换了一个组加一轮技术面和hr面,总体来讲实习面试更侧重实验室项目,秋招面试会细聊实习工作,每一轮的面试官都很nice,也都是一次很好的学习经历,感恩这一年和蚂蚁的相遇~ 一面(技术面) 介绍项目 遇到了什么问题 怎么解决的 介绍一下大数据的发展历程 项目选型,为什么用这些组件 介绍另一个项目 除了准确率还用了什么指
时间:8.17一面 问题: 1.项目 逐一介绍,不太深挖; 2.SQL ①一道题 在班级中60分以下的随机抽30人,60分以上的随机抽20人,说思路即可 考察SQL中的随机抽取函数order by rand(),这个知识点确实不常见; 这个题目是笔试中的题目,但当时时间原因没写上来,所以面试官又问了一遍,以后面的同学可以把笔试题目做下记录; ②如何优化性能的问题 3.ab实验知识点 ab实验的统计
一面:boss直聘,拷打项目,无八股。面试官简单介绍了项目的情况,反问。 二面:电话面,面试官一眼看出项目是网上的,我狂妄发言:“我是有自己的思考的”,然后被拷打,最后只憋出来了一条。 根据我之前的回答,面试官问了 1)数仓,业务系统,大数据平台的关系 根据jd,问了 2)py如何连接数据库,数据库游标、连接不释放会怎么样 3)hive分桶表,如何分桶,如何确定分桶的数量,分桶有什么用 4)怎么处
年前面试的 流程是机考,测评,再面试 (数仓)一面 聊得还行,不知道怎么挂了。。。可能是Spark这一块了解得太少了 自我介绍 你做的项目数据采集用的什么工具和原理? 有没有做过数据治理? 有没有做过数据血缘关系管理? 数据突增问题有没有遇到过?影响HDFS,如何解决? Hive表格存储用的哪个?什么原理? 数据某个阶段出现问题了,你怎么样定位出来? 数据倾斜有没有遇到过?怎么处理的? 数据之间的
二面就问了20min不到,吓死我了,不过已经发offer啦,分享下二面问的一些题目。 还是挖简历。 数仓建模核心 拉链表、快照表、全量表的区别 好像就这些~
1. 简历深挖 2. mysql binlog了解吗 3. shell脚本写过吗 4. 两个集群,一张hive表如何进行数据共享,A集群如何同步到B集群中 5. 一张订单表,支付状态会发生变化,如何采集到ods? 面试官说由于每张mysql表都是在系统上有应用的,所以应该用update的方式更新支付状态,不能采用数仓的方式去思考问题,不能用拉链表。数仓可以保存历史数据,但是mysql表必须要用up
游戏开发——数据工程,50分钟 问的都是八股 四类访问权限;四种内部类;反射机制;JMM内存模型;ArrayList和LinkedList;final VS finalize VS finally; 两道编程题: 有序列表合并;最长回文串 等消息
我是新的Azure数据工厂v2 我有一个文件夹,里面有两个文件。csv和F2。在blob存储中存储csv。 我创建了一个复制数据管道活动,用3个参数将数据从文件加载到azure DWH中的一个表中,并将其递归复制为false。 参数1:容器 参数2:目录 参数3:F1.csv 将上述参数用于复制数据活动时成功执行。 但数据是从两个文件加载的,只有一个文件作为活动的参数提供
问题内容: 我长期使用面向行的数据库设计,除了数据仓库项目和大数据样本外,我没有为OLTP应用程序使用面向列的数据库设计。 我的面向行的表看起来像 我们团队中的某些人提倡面向列的数据库设计。他们建议所有列名称都应该是“属性”表中的属性名称。然后,另一个表Quote将具有两列PropertyName和PropertyValue。 在.net代码中,我们读取每个键并进行比较并将其转换为强类型对象。代码
前言 哈喽大家好,我是chowley,今天来回顾一下之前参加的,车企测开技术面试 面试官针对前后端开发内容持续发问,本月最有含金量面试诞生了 部门:自动驾驶中心 时间:40min 平台:飞书 过程 双方自我介绍 怎么理解测试开发的角色? 在测试开发的角度来讲,你的开发需求是怎么来的? 在你的测试实习中,你的开发任务是怎么来的? 设计一个git commit的功能,开发不是测试! 用户新增了一段代码
我真的会谢这个破电脑,耳机连上去没声音,进去写代码共享屏幕黑屏,前半个小时黑屏了5次,一写代码黑屏断开视频断开共享屏幕,面试官不会怀疑我故意的吧救命,甚至刚开始刚连上面试官说了题目我准备写就黑屏,面试官都想着要不约时间,下次面,电脑又好了,像个炸弹一样随时黑屏 黑屏几次心态崩了问题都不会答了,算法考的不难 base:深圳 9.5一面(录音卡了点几次没录你敢信) 手写快排(你的算法的缺点,改进) 手
回馈牛客~面的是传媒技术部的数据分析,对接的是网易新闻 一面35分钟 1.简历深挖。挖得太细了,很多角度都是从未设想过的,不得不说业务做的多的人看细节真的很独到 2.机器学习相关。随机森林、逻辑回归原理,如何做特征筛选,评价指标 3.口述三道SQL 4.一道python数据清洗的题目,屏幕共享直接写 5.反问,介绍业务,然后给我提了点二面的建议 二面 主管面20分钟 1.AB实验样本不平衡怎么办
6.30一面 面试官很nice 1专业相关 为什么要跨专业考研 具体的专业在实际中的应用 2 问了个简单的sql 写错了 面试官一步步提醒终于写出来了 3 口述用栈 实现计算器功能 7.1 二面 1 简单sql 2 数仓理论 3 数据倾斜处理 滴滴面试官都是很有耐心 一步步提示你 解决问题 就算面不过体验也很不错。 7.11收到offer了
阿里 数据研发 8月底 一面 9月中 二面 30-40min,面试内容都差不多 大数据:hadoop了解多少?讲讲mapreduce,其中有几次排序?hive?hive调优? 数据仓库:星型,雪花,星座模型;数据分层 -- ODS,DWD,ADS,作用(我回答承上启下) 手撕SQL:窗口函数,查找连续三天的记录 等等数据仓库和大数据的问题 开放性问题:服装厂秋季生产什么样子的衣服? 实习经历,内容